AI & Statistics Lab

Projects 23

주요 LLM 모델 비교 및 한국어 특화 LLM 제안

주요 LLM 모델 비교 및 한국어 특화 LLM 제안주요 LLM 모델 개요각각의 최신 대형 언어 모델(LLM)에 대해 아키텍처, 훈련 데이터, 훈련 기법 등의 핵심 정보를 정리합니다. 또한 초기 버전부터 최신 버전까지의 발전도 함께 언급합니다.OpenAI GPT 시리즈 (GPT-3, GPT-3.5, GPT-4 등)모델 아키텍처: GPT 시리즈는 Transformer 디코더 기반의 언어 모델로, GPT-2의 아키텍처를 확장하여 GPT-3에서는 1750억 개 파라미터까지 규모를 키웠습니다. GPT-3의 경우 96개의 어텐션 레이어로 구성되며, 토큰 임베딩 크기 12288, 어텐션 헤드 96개 등의 설정을 사용한 것으로 알려져 있습니다. 컨텍스트 윈도우는 GPT-3에서 2048 토큰이었고, GPT-4에서는 맥스..

Projects 2025.06.22

리만 가설과 그 증명

리만 가설 — 정교한 소수 탐지기의 심장부“모든 비(非)자명한 영점은 𝜎 = ½ 위에 존재한다.”— 베른하르트 리만, 1859년1. 개요정의 복소수 $s=\sigma+it$ 에 대해 리만 제타 함수 $\zeta(s)$ 의 비자명한 영점 (trivial zeros : −2,−4,…을 제외한 모든 영점)이 임계선 $\sigma=\tfrac12$ 위에 놓인다는 주장이다. (en.wikipedia.org)위상 클레이 수학연구소의 밀레니엄 문제(상금 100만 달러) 중 하나이며, 증명이 완성되면 수학·암호·통계·물리 등 광범위한 분야의 이론이 정밀해진다.2. 리만 제타 함수 맛보기$$\zeta(s)=\sum_{n=1}^{\infty}\frac1{n^s}\quad(\Re(s)>1)$$아날리틱 확장을 통해 $s=1..

Projects 2025.06.20

인지 과학 기반의 적응적이고 견고한 AI 시스템 설계

인지 과학 기반의 적응적이고 견고한 AI 시스템 설계1. 서론1.1. 인지 과학과 AI의 교차점 소개인지 과학은 인간 인지의 내적 작동 방식을 이해하는 데 중점을 두며, 지각, 주의, 기억, 언어, 추론, 문제 해결과 같은 정신 과정을 탐구한다.1 반면, 인공지능(AI)은 인간의 인지 능력을 모방하거나 능가하는 지능형 시스템을 구축하는 것을 목표로 한다.1 이 두 분야는 인지 과정을 이해하고 복제한다는 공통된 목표를 공유하며, 상호 보완적인 관계를 형성한다. 인지 심리학은 인간 인지에 대한 풍부한 이론적 기반과 실험적 방법론을 제공하며, AI 연구자들은 이를 활용하여 보다 견고하고 인간과 유사한 AI 시스템을 개발할 수 있다.1이러한 맥락에서 인지 아키텍처는 인간 인지의 근본적인 메커니즘과 구조를 포착하..

Projects 2025.06.08

AI 개발: 인간 윤리 발달, 사회적 상호작용 및 피드백의 역할에서 얻은 이해를 통한 미묘하고 맥락을 인지하는 윤리적 행동 촉진 연구

AI 개발: 인간 윤리 발달, 사회적 상호작용 및 피드백의 역할에서 얻은 이해를 통한 미묘하고 맥락을 인지하는 윤리적 행동 촉진 연구요약본 보고서는 인간의 도덕적 및 인지적 발달에 대한 깊은 이해가 AI 시스템의 윤리적 행동과 지식 생성 능력을 향상시키는 데 어떻게 영감을 줄 수 있는지 탐구한다. 로렌스 콜버그(Lawrence Kohlberg)와 장 피아제(Jean Piaget)의 도덕 발달 이론, 앨버트 반두라(Albert Bandura)의 사회 인지 이론에서 얻은 통찰력은 AI가 단순히 규칙을 준수하는 것을 넘어, 미묘한 맥락을 인지하고, 의도를 이해하며, 자기 조절을 통해 윤리적으로 행동하도록 설계하는 데 중요한 지침을 제공한다.보고서는 현재 프롬프트 엔지니어링의 한계를 분석하고, 인간의 사회적 학..

Projects 2025.06.08

윤리적 AI 설계: 능동적 개발, 인간 감독, 그리고 AI 도덕적 추론의 미래 개척

윤리적 AI 설계: 능동적 개발, 인간 감독, 그리고 AI 도덕적 추론의 미래 개척요약이 보고서는 책임감 있는 인공지능(AI) 개발에 필요한 중요한 패러다임 전환을 심층적으로 다룬다. 즉, AI 윤리는 기술 발전의 부산물로 단순히 '창발'하는 것이 아니라, 의도적으로 '설계'되고 통합되어야 한다는 인식이 그 핵심이다. 보고서는 윤리적 AI를 이끄는 기본 원칙들을 탐구하며, 공정성, 투명성, 책임성을 타협할 수 없는 설계 필수 요소로 강조한다. 또한, 강력한 인간 감독 메커니즘(인간 개입형 시스템)과 지속적인 편향 감사 방법론을 포함한 현재의 운영 전략을 분석하고, 위험을 완화하고 신뢰를 구축하는 데 있어 이러한 전략의 역할을 조명한다. 나아가, AI의 '블랙박스' 특성과 진화하는 EU AI 법과 같은 규..

Projects 2025.06.08

인간의 내적 행동강령과 대화형 인공지능 시스템 프롬프트 심층 비교 분석: 행동 및 출력 지침의 유사점

인간의 내적 행동강령과 대화형 인공지능 시스템 프롬프트 심층 비교 분석: 행동 및 출력 지침의 유사점1. 서론인간의 말과 행동을 지배하는 근본적인 삶의 원칙, 가치관, 그리고 역할(부모, 직업 등)에 따른 내적 행동강령이 존재한다는 가설은 심리학, 사회학, 철학 분야에서 오랜 연구 주제였습니다. 흥미롭게도, 이러한 인간의 내적 지침 체계와 유사한 기능이 대화형 인공지능(AI)의 시스템 프롬프트에서도 관찰될 수 있다는 제안이 제기되었습니다. 본 보고서는 이러한 매력적인 비유를 탐구하며, 인간과 AI 시스템이 각자의 방식으로 어떻게 행동과 출력을 지침하는지 심층적으로 분석하고자 합니다.인간 행동의 근간을 이루는 원칙을 이해하는 것은 심리학적, 사회학적, 철학적 탐구에 있어 매우 중요합니다. 마찬가지로, AI..

Projects 2025.06.08

음성 데이터 기반 건강 상태 분석 AI 동향 및 전망

음성 데이터 기반 건강 상태 분석 AI 동향 및 전망소개 (Introduction)사람의 목소리는 건강 상태를 반영하는 중요한 단서로 여겨져 왔습니다. 숙련된 의사는 환자의 말소리만 듣고도 폐에 물이 찬 증상이나 신경계 질환의 징후를 감지하기도 합니다. 이런 음성 바이오마커(vocal biomarker)를 인공지능으로 자동 분석하면, 전문의가 아니더라도 목소리만으로 다양한 질병의 단서를 포착할 수 있게 됩니다. 이는 비침습적이고 간편한 방식으로 조기 선별이나 원격 모니터링을 제공할 수 있어 의료 현장에서 주목받고 있습니다.AI 기술이 환자의 음성을 분석하여 건강 상태를 진단하는 개념도. 음성 데이터는 일상 대화, 병원 진료 녹음, 전화 통화, 인위적 테스트 녹음 등 다양한 형태로 수집될 수 있으며, 알츠..

Projects 2025.05.29

인간 신경세포 발달을 모방한 범용 딥러닝 모델 설계

1. 생물학적 뉴런 발달의 딥러닝 모델 설계에 대한 영감인간 뇌의 신경망은 성장 초기에 과잉으로 연결을 형성한 뒤, 활용되지 않는 연결을 효과적으로 가지치기(pruning)하여 효율성을 높입니다. 실제로 유아기에는 뉴런 간 시냅스 연결 수가 폭발적으로 증가하지만 이후 성인에 이르기까지 그 절반 가량이 제거되어 보다 효율적인 회로로 정제됩니다. 이렇게 “초과 연결 후 선택적 제거”를 통해 필요한 회로만 남기는 뇌의 발달 원리는, 에너지와 자원 효율성이 중요한 인공지능 모델 설계에 직접적인 영감을 주었습니다. 예를 들어 Princeton 대학의 연구팀은 이러한 유아기 뇌 발달의 “성장-가지치기” 패턴을 모방한 Grow-and-Prune 방법을 제안하였는데, 단순 구조의 신경망을 훈련하면서 점진적으로 뉴런과 ..

Projects 2025.05.27

인공지능 지속학습(Continual Learning) 로드맵

아래 단계들은 “인간 뇌가 가소성과 안정성을 동시에 유지하며 평생 학습을 이어가는 과정”을 기계적으로 번역한 딥러닝-지속학습(continual learning) 설계 로드맵입니다. 각 단계마다 최근(2024–2025) 연구·산업 적용례를 곁들였습니다.1 단계 ― 기본 토대: 대규모 사전학습 모델 + 스트리밍 데이터 파이프라인해야 할 일 인간 메커니즘 대응 실무 팁‣ 대규모 사전학습(PLM·LLM·VLM)으로 “해마+신피질의 초기 스키마” 확보인간이 유아기에 핵심 감각·언어 스키마를 빠르게 구축하는 단계GPU 1~2대라면 Hugging Face PEFT(LoRA/IA3)나 bitsandbytes 4-bit 로딩으로 시작‣ 새 데이터가 실시간 또는 주기적으로 유입될 스트리밍 파이프라인 구축인간의 감각 스트림..

Projects 2025.05.25

인간의 평생 지식 축적 메커니즘에 대한 심층 과학 보고서

요약인간은 태아기 말기부터 노년기까지, 약 9 개월의 자궁 내 발달과 평균 80 여 년의 생애 동안 끊임없이 정보를 감각하고, 선택하며, 저장하고, 다시 구성한다. 본 보고서는 이처럼 연속적으로 진행되는 학습 과정을 열 개의 신경·인지 단계로 구분하여 분자 수준에서 사회적 맥락까지 계층적으로 해부하고, 이를 ‘하드웨어(신경가소성)’와 ‘소프트웨어(전략적 학습)’라는 두 축으로 통합한 다층 동적 모델을 제안한다. 각 단계마다 대표적인 실험·임상·영상 연구를 근거로 제시하고, 수면·운동·사회적 교류와 같은 환경적 조절 인자가 시냅스 가소성과 메타인지 전략을 어떤 방식으로 증폭 또는 억제하는지 정량적 데이터를 이용해 상세히 설명한다. 마지막으로 개인·교육·조직 차원에서 적용 가능한 실천 가이드와 정책 제언을 ..

Projects 2025.05.25