전체 글 142

프롬프트를 코드로, DSPy 탐구 시리즈 - ① 홈페이지, 깃허브, 논문 요약

DSPy 공식 홈페이지https://dspy.ai/ DSPyThe framework for programming—rather than prompting—language models.dspy.aiDSPy githubhttps://github.com/stanfordnlp/dspy GitHub - stanfordnlp/dspy: DSPy: The framework for programming—not prompting—language modelsDSPy: The framework for programming—not prompting—language models - stanfordnlp/dspygithub.comDSPy의 핵심 논문 DSPy: Compiling Declarative Language Model Ca..

50년 전 돌아가신 외할아버지를 다시 볼 수 있을까? - 추석에 시작된 AI 사진 복원 프로젝트

이번 추석, 오랜만에 찾은 시골 외가댁에서 낡은 서랍장을 열었습니다. 오래된 편지와 영수증 사이에서 낡은 흑백 사진 한 장을 발견했어요. 사진 속에는 50년 전 돌아가신 외할아버지와 외할머니가 계셨습니다. 외할아버지는 한 번도 뵌 적 없었지만, 엄마 얼굴 어딘가에서 외할아버지의 눈매를 찾을 수 있었습니다. 그리고 외할아버지... 너무 잘생기셔서 놀랐습니다. (이런 비주얼이 우리 집안 유전자에 있었다니) "이 사진, 복원할 수 있지 않을까?" 최근까지 배워온 AI 기술이 이번엔 조금 다른 의미로 다가왔습니다. 포트폴리오를 채우기 위한 단순 프로젝트가 아니라 가족을 위한 작은 선물이 될 수 있겠다는 생각이 들었습니다. 핸드폰으로 사진을 촬영하고, 생성형 AI를 활용해 손상된 부분을 되살렸습니다. 흑..

나의 이야기 2025.10.11

MongoDB 자연어 쿼리 생성 모델 만들기

https://huggingface.co/solbi12/ax4-mongodb-query-generator solbi12/ax4-mongodb-query-generator · Hugging Face🚀 A.X-4.0-Light MongoDB Query Generator 한국어 자연어를 MongoDB 쿼리로 변환하는 AI 모델 SKT A.X-4.0-Light 기반으로 파인튜닝된 전문 데이터베이스 쿼리 생성 모델 📋 모델 개요 이 모델은 SKT의 A.X-4.0-Lighthuggingface.co 왜 이런 걸 만들게 됐나?MongoDB 쿼리 문법이 정말 골치 아프다. SQL은 그나마 직관적인데, MongoDB의 aggregate 파이프라인이나 복잡한 find 조건들은 매번 구글링하게 된다. "브랜드별 평균 가..

보고서 생성 모델을 위한 MongoDB 데이터 추출 전략 연구

현재 파악한 아키텍처 흐름보고서 생성 시스템의 전체 데이터 흐름을 정리해보니:MongoDB (원시 데이터) → 데이터 추출 & 가공 → 모델 입력 형태 → KoBART → 보고서 출력각 단계마다 어떤 처리가 필요한지 구체적으로 파악해야 겠다.MongoDB에서 추출해야 할 데이터 유형 분석이커머스 보고서에 필요한 핵심 데이터매출 관련 데이터// orders 컬렉션에서 추출할 데이터{ "date_range": "2024-03-01 to 2024-03-31", "total_revenue": 1200000000, "order_count": 15847, "avg_order_value": 75692, "revenue_growth": 15.3 // 전월 대비 %} 고객 행동 데이터// users, user..

AI 보고서 생성 모델 연구 일지 (KoBART_SKT)

https://cat-b0.tistory.com/147 AI/ML 핵심 기술 분석: LoRA, RAG, Large Language Diffusion Models(LLDM)오늘 하루 종일 파인튜닝이라는 개념을 파헤쳤다. 처음엔 단순히 "모델은 내 데이터로 다시 학습시키는 것" 정도로만 이해했는데 학습 기법에도 여러가지가 있었다. 파인튜닝이 뭔지 이해하려cat-b0.tistory.com 보고서 생성 분야 현황 분석검색을 통해 보고서 생성 분야의 현황을 파악해봤다. 생각보다 훨씬 큰 시장이고 실제 기업들이 활발하게 도입하고 있는 분야였다.시장 규모와 성장 전망글로벌 자연어 생성 시장이 2024년 8.8억 달러에서 2028년 19.1억 달러로 성장할 것으로 예상된다고 한다. 연평균 성장률이 21.4%라니 정말 ..

AI/ML 핵심 기술 분석: LoRA, RAG, Large Language Diffusion Models(LLDM)

오늘 하루 종일 파인튜닝이라는 개념을 파헤쳤다. 처음엔 단순히 "모델은 내 데이터로 다시 학습시키는 것" 정도로만 이해했는데 학습 기법에도 여러가지가 있었다. 파인튜닝이 뭔지 이해하려고 삽질한 과정 Q. 왜 처음부터 학습하면 안되는가? GPT나 BERT 같은 모델들이 이미 완성된 상태인데 왜 또 학습을 시켜야되는지 의문이었다. 여러 자료를 찾아보니 핵심은 일반화 VS 특화 였다. 대형 언어 모델들은 인터넷의 거의 모든 텍스트로 학습되어있다. 위키피디아, 뉴스, 소설, 논문, 댓글까지 이렇게 학습된 모델은 일반적인 언어 패턴은 잘 이해하지만 내가 원하는 특정 작업(보고서 작성) 에는 최적화되어있지 않다. 예를 들어보자면 GPT-4는 일반적인 대화는 잘하지만, 내가 만약 의료진을 위한 AI를 만들고 싶..

한국어 자연어 기반 MongoDB 자동 질의 시스템: 모델 구조 고민

프로젝트 배경 회사에서 넘쳐나는 데이터를 자연어로 쉽게 가져오고, 분석까지 해주는 솔루션을 만들고 싶었다. 프로젝트 구조 분석 실제로 3개의 다른 AI 모델이 협력하는 시스템 1단계: 자연어 → MongoDB 쿼리 변환목적 : "지난 달 서울 지역 매출 데이터 가져와줘" → MongoDB 쿼리 필요 모델- Text-to-SQL/NoSQL 모델 (몽고DB를 사용할 예정이니 MQL)- 또는 LLM + 프롬프트 엔지니어링 (GPT, Claude 등) 2단계 : 데이터 예측 / 분석목적 : 추출된 데이터로 패턴 분석, 예측 필요 모델 : 전통적인 ML 모델 ( scikit-learn, XGBoost 등 ) 또는 딥러닝 모델 (시계열 예측 등) 3단계 : 보고서 생성 목적 : 분석 결과를 자연어 보고서로 작..

HATW 프로젝트 회고: 4주 만에 휠체어 전용 네비게이션 만들기

문제 정의부터 시작했다기존 내비게이션이 완벽해 보이는데 굳이 새로 만들 필요가 있나? 처음엔 의문이었다.하지만 데이터를 보니 명확했다:T-map, 네이버맵: 일반 보행자 기준계단/육교/에스컬레이터 = 물리적 장벽 미고려엘리베이터 고장, 공사 구간 = 실시간 반영 불가결론: 필요하다. 기술 스택 결정 과정Backend 선택: Spring BootNode.js도 고려했지만 기각했다.이유:- 복잡한 경로 알고리즘 → Java 안정성 필요- 지리 정보 쿼리 → MyBatis 적합- 인증 시스템 → Spring Security 검증됨 Frontend: ReactVue.js보다 단순한 이유들:지도 API 레퍼런스 많음컴포넌트 재사용성 높음React Router 직관적 Database: MySQLNoSQL 검토했지..

AI Agent 심층 탐구

1. AI Agent란 무엇인가?AI Agent는 환경을 지각(Perception) → 의사결정(Decision Making) → **행동(Action)**을 수행하는 지능형 주체단순한 입력-출력 프로그램이 아니라 데이터와 경험을 통해 학습하면서 상황에 적용한다. 최신 AI Agent는 다음과 같은 기술로 강화된다. 멀티모달 모델: 텍스트·이미지·음성 등 다양한 입력을 동시에 처리RAG(Retrieval-Augmented Generation): 외부 지식 검색 후 답변 생성MCP(Model Context Protocol): 외부 도구·DB·서비스와 표준화된 연결핵심 : 환경과 상호작용하면서 목표를 달성하는 인공지능 시스템 2. 핵심 구성 요소 탐구 RAG (Retrieval-Augmented Gen..