AI & Statistics Lab

분류 전체보기 92

거대언어모델(LLM), 멀티모달모델(LMM), 거대행동모델(LAM)

거대언어모델(LLM), 멀티모달모델(LMM), 거대행동모델(LAM)요약 (Summary)거대언어모델(LLM), 멀티모달모델(LMM), 거대행동모델(LAM)은 인공지능 모델의 세 가지 주요 범주로, 텍스트 기반 언어 처리, 다중 모달리티 처리, 행동 및 작업 수행이라는 각기 다른 핵심 기능을 갖추고 있습니다. LLM은 대규모 텍스트 데이터로 학습된 언어 모델로서 인간 수준의 언어 이해와 생성을 수행하며, GPT-4나 Claude와 같은 최신 LLM들은 수십억~수조 개의 매개변수를 활용해 다양한 자연어 처리 작업에서 뛰어난 성능을 보입니다. LMM은 텍스트, 이미지, 음성, 영상 등 여러 종류의 데이터를 동시에 이해하고 생성할 수 있는 모델로, 예를 들어 OpenAI GPT-4와 Google DeepMind..

기타 2025.06.25

주요 LLM 모델 비교 및 한국어 특화 LLM 제안

주요 LLM 모델 비교 및 한국어 특화 LLM 제안주요 LLM 모델 개요각각의 최신 대형 언어 모델(LLM)에 대해 아키텍처, 훈련 데이터, 훈련 기법 등의 핵심 정보를 정리합니다. 또한 초기 버전부터 최신 버전까지의 발전도 함께 언급합니다.OpenAI GPT 시리즈 (GPT-3, GPT-3.5, GPT-4 등)모델 아키텍처: GPT 시리즈는 Transformer 디코더 기반의 언어 모델로, GPT-2의 아키텍처를 확장하여 GPT-3에서는 1750억 개 파라미터까지 규모를 키웠습니다. GPT-3의 경우 96개의 어텐션 레이어로 구성되며, 토큰 임베딩 크기 12288, 어텐션 헤드 96개 등의 설정을 사용한 것으로 알려져 있습니다. 컨텍스트 윈도우는 GPT-3에서 2048 토큰이었고, GPT-4에서는 맥스..

Projects 2025.06.22

리만 가설 이해하기

리만 가설 이해하기서론: 리만 가설의 개요리만 가설은 1859년 독일의 저명한 수학자 베른하르트 리만(Bernhard Riemann)에 의해 제안된, 수학 분야의 가장 중요하고 아직 해결되지 않은 난제 중 하나입니다. 본 가설은 자연수 내 소수(prime numbers)의 분포와 밀접하게 관련된 복소 함수인 리만 제타 함수(Riemann Zeta function)의 '비자명한 영점(non-trivial zeros)'의 위치에 대한 근본적인 명제입니다.구체적으로, 리만 가설은 특정 복소 함수인 리만 제타 함수의 모든 비자명한 영점들이 복소 평면 상의 '임계선(critical line)'이라고 명명된 특정한 직선, 즉 실수부가 $\frac{1}{2}$인 직선 위에 존재한다는 것을 주장합니다. 본 가설의 중요..

기타 2025.06.21

리만 가설과 그 증명

리만 가설 — 정교한 소수 탐지기의 심장부“모든 비(非)자명한 영점은 𝜎 = ½ 위에 존재한다.”— 베른하르트 리만, 1859년1. 개요정의 복소수 $s=\sigma+it$ 에 대해 리만 제타 함수 $\zeta(s)$ 의 비자명한 영점 (trivial zeros : −2,−4,…을 제외한 모든 영점)이 임계선 $\sigma=\tfrac12$ 위에 놓인다는 주장이다. (en.wikipedia.org)위상 클레이 수학연구소의 밀레니엄 문제(상금 100만 달러) 중 하나이며, 증명이 완성되면 수학·암호·통계·물리 등 광범위한 분야의 이론이 정밀해진다.2. 리만 제타 함수 맛보기$$\zeta(s)=\sum_{n=1}^{\infty}\frac1{n^s}\quad(\Re(s)>1)$$아날리틱 확장을 통해 $s=1..

Projects 2025.06.20

인공지능(AI)-에너지 연계: 기회, 도전, 그리고 지속가능한 미래

인공지능(AI)-에너지 연계: 기회, 도전, 그리고 지속가능한 미래I. 서론에너지 부문은 현대 사회의 근간을 이루며, 모든 산업과 일상생활에 필수적인 동력을 제공한다. 전력 생산, 송전, 배전, 소비의 각 단계에서 효율성, 신뢰성, 그리고 지속가능성 확보는 국가 경제와 국민 생활의 안정에 직결되는 중요한 과제이다.1 전 세계적으로 화석 연료 소비에 대한 우려가 증가하고 기후 변화에 대응하기 위한 탄소 순배출 제로(Net-Zero) 목표 달성의 압박이 커지면서, 에너지 시스템의 효율성과 친환경성 개선은 전례 없는 시급성을 띠고 있다.1이러한 배경 속에서 인공지능(AI)은 인간의 지능을 필요로 하는 작업을 수행할 수 있는 이론이자 소프트웨어로서, 기계가 학습, 추론, 새로운 환경에 적응할 수 있도록 지원하며..

기타 2025.06.18

한국 부동산 제도 분석 및 해외 사례 비교를 통한 개선 방안

한국 부동산 제도 분석 및 해외 사례 비교를 통한 개선 방안서론한국의 부동산 시장은 주택 가격 급등과 투자 열풍으로 인한 사회적 문제가 지속되어 왔습니다. 특히 수도권을 중심으로 한 집값 폭등은 국민의 주거 부담을 가중시키고 있으며, 부동산 소유 여부에 따른 계층 격차까지 야기하고 있습니다. 이러한 부동산 시장 불안은 단기적 현상에 그치지 않고 구조적 원인을 내포하고 있어, 제도적 접근을 통한 근본적인 해결책 모색이 요구됩니다. 이 글에서는 한국 부동산 제도의 현황과 구조적 문제점을 진단하고, 해외 부동산 선진국으로 평가받는 독일, 싱가포르, 일본, 프랑스, 캐나다 등의 사례와 비교 분석함으로써 시사점을 도출하고자 합니다. 이를 토대로 한국 부동산 시장 안정과 주거 안정성 제고를 위한 단기·중기·장기별 ..

기타 2025.06.18

입시지옥을 넘어: 대한민국 대학입시 혁신의 길

입시지옥을 넘어: 대한민국 대학입시 혁신의 길개요 (Introduction)대한민국의 대학 입시제도는 오랜 기간 고도 성장과 인재 선발의 수단으로 기능해왔지만, 지나친 경쟁과 학업 스트레스, 과도한 사교육 의존, 공정성 논란 등 많은 문제점을 노출하고 있습니다. 이 글은 2025년 기준 한국의 대학 입시 구조와 특징을 분석하고, 입시제도가 잘 갖춰졌다고 평가받는 주요 국가(미국, 핀란드, 독일, 일본)의 제도와 주요 항목별로 비교합니다. 이를 통해 한국 입시제도의 문제점을 진단하고, 학생 학업 스트레스 완화와 사교육 감소를 목표로 한 단기·중기·장기 개선방안을 제안합니다. 마지막으로 주요 비교 내용을 표로 정리하여 독자의 이해를 돕겠습니다.대한민국의 대학 입시제도 (2025년 기준)한국의 대학 입시제도는..

기타 2025.06.17

대한민국 AI 3대 강국 도약 및 제조 AI 혁신 전략

대한민국 AI 3대 강국 도약 및 제조 AI 혁신 전략서론: 목표와 도전대한민국은 “AI 3대 강국”과 “제조 AI 혁신”을 국가 목표로 선포하며, 인공지능 기술을 통해 미래 산업 경쟁력을 확보하고자 합니다. 이는 미국과 중국에 필적하는 AI 역량을 갖추고, 전통적인 제조업을 첨단 AI와 융합하여 혁신을 이루겠다는 비전입니다. 최근 등장한 초거대 언어모델(LLM, Large Language Model) 기반 생성형 AI의 혁신과 이를 활용한 AI 에이전트(agent) 기술 발전은 이러한 목표 달성의 핵심 동력이 되고 있습니다. 이 글에서는 최신 국내외 AI 동향을 분석하고, 대한민국이 AI G3(글로벌 3위권 AI 강국)로 도약하기 위해 필요한 전략과 실행 로드맵을 제안합니다. 주요 내용은 다음과 같습니..

기타 2025.06.17

"VLRM: Vision-Language Models act as Reward Models for Image Captioning" 논문 리뷰

VLRM: 이미지 캡셔닝을 위한 비전-언어 모델을 보상 모델로 활용이 논문은 이미지 캡셔닝 모델, 특히 BLIP2를 강화 학습(Reinforcement Learning, RL)과 CLIP 및 BLIP2-ITM과 같은 비전-언어 모델(Vision-Language Models, VLM)을 보상 모델(Reward Model)로 활용하여 향상시키는 비지도 학습(unsupervised) 방식을 제안합니다. 이 방법을 통해 RL로 튜닝된 모델은 더 길고 포괄적인 설명을 생성할 수 있으며, MS-COCO Carpathy Test Split에서 인상적인 0.90 R@1 CLIP Recall 점수를 달성했습니다.1. 문제점 및 동기최근 개발된 이미지 캡셔닝 모델들은 인상적인 성능을 보여주었지만, 종종 캡션에 세부 정보가..

Paper Review 2025.06.15

wav2vec 2.0 논문 리뷰

wav2vec 2.0: 음성 표현의 자기 지도 학습을 위한 프레임워크이 논문은 레이블링되지 않은 음성 오디오만으로 강력한 표현(representation)을 학습하고, 이를 레이블링된 음성 데이터로 미세 조정(fine-tuning)하여, 기존의 최첨단 반 자기 지도(semi-supervised) 방법보다 우수한 성능을 달성할 수 있음을 처음으로 보여주는 연구입니다.1. 서론 및 배경 신경망은 대량의 레이블링된 훈련 데이터로부터 이점을 얻습니다. 그러나 전 세계 약 7,000개 언어의 대다수에서는 수천 시간의 전사된 음성 데이터 확보가 어렵기 때문에, 현재 음성 인식 시스템을 구축하기 어렵습니다. 인간의 언어 습득 방식이 레이블링된 예제로부터만 배우는 것과 다르다는 점에 착안하여, 이 연구는 자기 지도 학..

Paper Review 2025.06.15