1단계 — 지식 기반(코퍼스) 설계 & 데이터 파이프라인구성 요소 설계 포인트 이유다층 지식 저장소· 기성 대규모 텍스트(웹+도서+학술)· 도메인별 레퍼런스(논문·코드·법령 등)· 동적 웹 검색 커넥터· 원천 문서에 고유 ID·메타데이터 부여· chunk ↔ citation 양방향 매핑 테이블 구축“출처 태그”가 살아있어야 후단(메타인지·사실 검증)에서 근거를 확인·인용 가능 (ACM 통신)데이터 품질 루프· 다단계 필터: 저품질·중복·허위 제거· 검증 실패 사례를 주기적으로 추가 학습데이터 노이즈가 “학습-->믿음(=망상)”으로 굳는 것을 차단 (arXiv)2단계 — 기본 언어모델(Encoder-Decoder) & “빠른 사고” 회로모델 크기·토크나이저: 7B~34B 토큰 단위로 실험 → 도메인 특화일..