AI & Statistics Lab

분류 전체보기 92

s3: You Don't Need That Much Data to Train a Search Agent via RL 논문 리뷰

주요 포인트연구는 s3 프레임워크를 제안하며, 이는 강화 학습(RL)을 통해 검색 에이전트를 효율적으로 훈련시켜 RAG 시스템의 성능을 향상시킵니다.s3는 2.4k 샘플만으로 기존 방법보다 우수한 성능을 달성하며, 검색과 생성을 분리해 모델 독립성을 제공합니다.실험 결과, 6개의 일반 QA와 5개의 의료 QA 벤치마크에서 s3가 뛰어난 성능을 보였고, 도메인 전이 가능성을 입증했습니다.한계로는 생성기 품질 의존성, 보상 계산 비용, 데이터 편향 가능성을 지적하며, 미래 연구 방향을 제시합니다.상세 리뷰 노트서론 및 배경"s3: You Don't Need That Much Data to Train a Search Agent via RL"라는 제목의 논문은 Pengcheng Jiang 외 여러 저자가 작성했..

Paper Review 2025.06.01

음성 데이터 기반 건강 상태 분석 AI 동향 및 전망

음성 데이터 기반 건강 상태 분석 AI 동향 및 전망소개 (Introduction)사람의 목소리는 건강 상태를 반영하는 중요한 단서로 여겨져 왔습니다. 숙련된 의사는 환자의 말소리만 듣고도 폐에 물이 찬 증상이나 신경계 질환의 징후를 감지하기도 합니다. 이런 음성 바이오마커(vocal biomarker)를 인공지능으로 자동 분석하면, 전문의가 아니더라도 목소리만으로 다양한 질병의 단서를 포착할 수 있게 됩니다. 이는 비침습적이고 간편한 방식으로 조기 선별이나 원격 모니터링을 제공할 수 있어 의료 현장에서 주목받고 있습니다.AI 기술이 환자의 음성을 분석하여 건강 상태를 진단하는 개념도. 음성 데이터는 일상 대화, 병원 진료 녹음, 전화 통화, 인위적 테스트 녹음 등 다양한 형태로 수집될 수 있으며, 알츠..

Projects 2025.05.29

인간 신경세포 발달을 모방한 범용 딥러닝 모델 설계

1. 생물학적 뉴런 발달의 딥러닝 모델 설계에 대한 영감인간 뇌의 신경망은 성장 초기에 과잉으로 연결을 형성한 뒤, 활용되지 않는 연결을 효과적으로 가지치기(pruning)하여 효율성을 높입니다. 실제로 유아기에는 뉴런 간 시냅스 연결 수가 폭발적으로 증가하지만 이후 성인에 이르기까지 그 절반 가량이 제거되어 보다 효율적인 회로로 정제됩니다. 이렇게 “초과 연결 후 선택적 제거”를 통해 필요한 회로만 남기는 뇌의 발달 원리는, 에너지와 자원 효율성이 중요한 인공지능 모델 설계에 직접적인 영감을 주었습니다. 예를 들어 Princeton 대학의 연구팀은 이러한 유아기 뇌 발달의 “성장-가지치기” 패턴을 모방한 Grow-and-Prune 방법을 제안하였는데, 단순 구조의 신경망을 훈련하면서 점진적으로 뉴런과 ..

Projects 2025.05.27

“Sufficient Context: A New Lens on Retrieval Augmented Generation Systems” 논문의 주요 내용

아래는 “Sufficient Context: A New Lens on Retrieval Augmented Generation Systems” 논문의 주요 내용을 정리한 후, 논문에서 제안한 선택적 생성(selective generation) 방법을 중심으로 파이썬 구현 예시를 제시한 코드입니다.논문 요약문제 제기 및 동기대형 언어모델(LLM)에 외부 컨텍스트를 제공하는 RAG(Retrieval Augmented Generation) 시스템은 사실성(factuality)을 크게 향상시키지만, 여전히 모델이 잘못된 답을 자신 있게 생성하거나 불필요한 정보에 주의를 빼앗기는 문제가 존재한다.이 오류의 원인이 “컨텍스트가 충분치 않아서”인지, “모델이 충분한 컨텍스트를 활용하지 못해서”인지 명확하지 않다.충분한..

Paper Review 2025.05.26

인공지능 지속학습(Continual Learning) 로드맵

아래 단계들은 “인간 뇌가 가소성과 안정성을 동시에 유지하며 평생 학습을 이어가는 과정”을 기계적으로 번역한 딥러닝-지속학습(continual learning) 설계 로드맵입니다. 각 단계마다 최근(2024–2025) 연구·산업 적용례를 곁들였습니다.1 단계 ― 기본 토대: 대규모 사전학습 모델 + 스트리밍 데이터 파이프라인해야 할 일 인간 메커니즘 대응 실무 팁‣ 대규모 사전학습(PLM·LLM·VLM)으로 “해마+신피질의 초기 스키마” 확보인간이 유아기에 핵심 감각·언어 스키마를 빠르게 구축하는 단계GPU 1~2대라면 Hugging Face PEFT(LoRA/IA3)나 bitsandbytes 4-bit 로딩으로 시작‣ 새 데이터가 실시간 또는 주기적으로 유입될 스트리밍 파이프라인 구축인간의 감각 스트림..

Projects 2025.05.25

인간의 평생 지식 축적 메커니즘에 대한 심층 과학 보고서

요약인간은 태아기 말기부터 노년기까지, 약 9 개월의 자궁 내 발달과 평균 80 여 년의 생애 동안 끊임없이 정보를 감각하고, 선택하며, 저장하고, 다시 구성한다. 본 보고서는 이처럼 연속적으로 진행되는 학습 과정을 열 개의 신경·인지 단계로 구분하여 분자 수준에서 사회적 맥락까지 계층적으로 해부하고, 이를 ‘하드웨어(신경가소성)’와 ‘소프트웨어(전략적 학습)’라는 두 축으로 통합한 다층 동적 모델을 제안한다. 각 단계마다 대표적인 실험·임상·영상 연구를 근거로 제시하고, 수면·운동·사회적 교류와 같은 환경적 조절 인자가 시냅스 가소성과 메타인지 전략을 어떤 방식으로 증폭 또는 억제하는지 정량적 데이터를 이용해 상세히 설명한다. 마지막으로 개인·교육·조직 차원에서 적용 가능한 실천 가이드와 정책 제언을 ..

Projects 2025.05.25

IP 거래 목적 AI 가치평가 모델 검증 프레임워크

아래 절차는 IP 거래 목적 AI 가치평가 모델이 실제 계약·회계 보고서·담보 심사 등에 쓰일 때 “신뢰할 만하다”는 것을 증명하는 전사(全社)적 검증 프레임워크입니다. 국제 밸류에이션 표준(IVS 2024), ISO 10668(브랜드), IFRS 13(공정가치), 美 연준 SR 11-7(Model Risk Management) 등의 요구사항을 모두 교차 반영했습니다. (ivsc.org, Brand Finance, IFRS Foundation, Home)1. 거버넌스 - “세 줄 방어선” 구축Line 책임 주체 핵심 역할1차 (개발)데이터·모델 엔지니어설계·코딩, 자기검증, 문서화2차 (독립 검증)모델리스크 전담 조직·외부 감정평가사개념·코드·성능 검증, 승인/거절 권한3차 (감사)내부감사·외부 감사법인..

Projects 2025.05.24

IP(지식재산권)의 금전적 가치를 정량화-예측하는 AI 기반 가치평가 모델

다음 절차는 “거래 목적”으로 특허·상표·저작권 등 IP(지식재산권)의 금전적 가치를 정량화-예측하는 AI 기반 가치평가 모델을 처음 설계‧구축‧운용할 때 필요한 전 과정을 단계별로 정리한 청사진입니다.(예시는 특허·상표 위주로 설명하지만, 저작권·영업비밀에도 동일한 프레임을 응용할 수 있습니다.)1️⃣ 목표·출력 정의항목 설명평가 대상특허(단일·포트폴리오), 상표, 저작권, 복합 IP 번들거래 시나리오• 일시 양도/매각 • 라이선스(고정∙로열티) • 담보(담보대출·수권)출력 포맷(a) 범위 ±신뢰구간을 갖는 FMV(Fair Market Value) 추정치 (b) 거래유형별 권장 로열티율/가격 밴드 (c) 설명가능성 지표(기여도 TOP-K feature)업데이트 주기최소 분기 1회 데이터 보강·재학습 →..

Projects 2025.05.24

인공지능 시대의 대학교육

1. 대학 교육의 본래 목적부터 다시 보기지식 창출과 전수: 대학은 단순 직업훈련소가 아니라, 새로운 지식을 탐구하고 비판적으로 성찰할 수 있는 ‘지적 인프라’를 유지‧확산하는 데 핵심 역할을 합니다.장기적 적응력: 산업 현장은 3–5년마다 기술 스택이 뒤바뀝니다. 이런 환경에서 진짜 경쟁력은 ‘현재 기술’이 아니라 추상화·원리·문제 해결 능력을 익힌 사람에게 생깁니다.시민·전문가·연구자 세 가지 트랙: 교수법과 커리큘럼은 이 세 역량을 균형 있게 키우도록 설계돼야 합니다.2. 실용 기술만 가르칠 때 얻는 이득과 위험 장점잠재적 위험즉시 전력화졸업 후 곧바로 기업에서 투입 가능툴·프레임워크 수명주기에 종속업계 적합성채용 시 ‘가르칠 비용’ ↓특정 기업·플랫폼에 과도하게 종속학습 동기 부여학생이 결과를 빨..

기타 2025.05.24

LLM 환각 방지 및 완화 기술 제안

오픈소스 LLM 환각 방지 및 완화 기술 제안사용자 질문에 신뢰할 수 있는 답변을 생성하기 위해 대규모 언어 모델(LLM)의 환각(hallucination) 현상을 줄이는 다양한 기술들을 종합적으로 검토하였습니다. 환각이란 LLM이 그럴듯하지만 사실과 맞지 않는 정보를 만들어내는 현상을 말하며, 이는 AI 솔루션의 신뢰성을 떨어뜨리는 큰 요인입니다. 아래에서는 오픈소스 LLM을 활용하면서도 사실에 기반한 응답을 보장하기 위한 현재까지 제안된 핵심 기법들과 사례를 분야별로 정리하고, 각 접근법의 실용적인 고려사항을 함께 제안합니다.LLM 환각 방지 및 완화를 위한 주요 기술 동향지식 검색 결합 (Retrieval-Augmented Generation, RAG): 외부 지식베이스나 검색 엔진을 통합하여 모델..

카테고리 없음 2025.05.24