KoBART 2

보고서 생성 모델을 위한 MongoDB 데이터 추출 전략 연구

현재 파악한 아키텍처 흐름보고서 생성 시스템의 전체 데이터 흐름을 정리해보니:MongoDB (원시 데이터) → 데이터 추출 & 가공 → 모델 입력 형태 → KoBART → 보고서 출력각 단계마다 어떤 처리가 필요한지 구체적으로 파악해야 겠다.MongoDB에서 추출해야 할 데이터 유형 분석이커머스 보고서에 필요한 핵심 데이터매출 관련 데이터// orders 컬렉션에서 추출할 데이터{ "date_range": "2024-03-01 to 2024-03-31", "total_revenue": 1200000000, "order_count": 15847, "avg_order_value": 75692, "revenue_growth": 15.3 // 전월 대비 %} 고객 행동 데이터// users, user..

AI 보고서 생성 모델 연구 일지 (KoBART_SKT)

https://cat-b0.tistory.com/147 AI/ML 핵심 기술 분석: LoRA, RAG, Large Language Diffusion Models(LLDM)오늘 하루 종일 파인튜닝이라는 개념을 파헤쳤다. 처음엔 단순히 "모델은 내 데이터로 다시 학습시키는 것" 정도로만 이해했는데 학습 기법에도 여러가지가 있었다. 파인튜닝이 뭔지 이해하려cat-b0.tistory.com 보고서 생성 분야 현황 분석검색을 통해 보고서 생성 분야의 현황을 파악해봤다. 생각보다 훨씬 큰 시장이고 실제 기업들이 활발하게 도입하고 있는 분야였다.시장 규모와 성장 전망글로벌 자연어 생성 시장이 2024년 8.8억 달러에서 2028년 19.1억 달러로 성장할 것으로 예상된다고 한다. 연평균 성장률이 21.4%라니 정말 ..