TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
373635343332313029282726
AI
LLM 에이전트 평가 파이프라인 — golden set 구축부터 LangSmith·Phoenix 운영까지
LLM 에이전트를 "느낌"이 아닌 수치로 검증하는 평가 시스템. golden set 설계, 자동 채점, 회귀 감시까지 6개월 운영 노하우.
AI
LLM 추론 비용 최적화 — 캐싱·배치·라우팅으로 70% 절감하는 7가지 기법
LLM API 운영 비용 70% 절감하는 7가지 실전 기법. 프롬프트 캐싱·배치 API·모델 라우팅·프롬프트 압축 가이드.
AI
LangGraph 0.5 멀티에이전트 패턴 — Supervisor·Swarm·Hierarchical 실전 가이드
LangGraph 0.5의 멀티에이전트 토폴로지 3종(Supervisor, Swarm, Hierarchical) 구조·구현·트레이드오프를 실전 코드로 정리.
AI
Claude Opus 4.7 1M 컨텍스트 — 코드베이스 전체를 한 번에 읽히는 실전 가이드
Opus 4.7의 1M 토큰 컨텍스트로 전체 레포를 한 번에 분석하는 패턴, 토큰 비용·캐싱 전략, 마이그레이션 주의점.
AI
LLM 비용 최적화 종합 — 캐싱·라우팅·프롬프트 압축·로컬 폴백
LLM API 비용을 5~10배 줄이는 검증된 5가지 기법 — Prompt Caching, Model Routing, Prompt Compression, Local Fallback, Batch API. 실측 사례.
AI
AI 에이전트 디자인 패턴 7가지 — Reflexion·ReAct·Plan-Execute·Multi-Agent 실전
LLM 에이전트 시스템 설계의 7가지 핵심 패턴 — 각 패턴이 적합한 워크로드, 구현 코드 스니펫, 비용·정확도 트레이드오프 정리.
AI
GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro 실전 비교 — 코드·분석·창작
2026년 4월 기준 프런티어 LLM 3종을 코드 작성·문서 분석·창작·비용 4개 영역에서 직접 비교. 실측 결과로 보는 작업별 최적 모델.
AI
MCP(Model Context Protocol) 완전 가이드 — AI 에이전트와 외부 도구 연결하는 표준
MCP는 LLM과 외부 도구·데이터를 연결하는 표준 프로토콜이다. 서버·클라이언트 구조, Resources/Tools/Prompts 3대 프리미티브, 구현 패턴을 정리한다.
AI
RAG(Retrieval-Augmented Generation) 실전 구축 가이드 — 벡터DB 선택부터 청크 전략까지
RAG는 LLM에 외부 지식을 주입하는 표준 패턴이다. 청크 전략·임베딩 선택·벡터DB·리랭킹·평가 지표까지 실전 설계 기준을 정리한다.
AI
Claude 4.6 Opus & Sonnet 완전 분석 — 1M 컨텍스트 시대의 실전 활용법
Anthropic Claude 4.6 Opus/Sonnet 1M 컨텍스트, Adaptive Thinking, Agent Teams 등 핵심 변경사항과 실전 활용법 정리
AI
DeepSeek V4 아키텍처 완전 분석 — 1조 파라미터 MoE의 비밀
DeepSeek V4의 1조 파라미터 MoE 아키텍처, Engram Memory, Lightning Indexer 기술을 상세 분석합니다. GPT-5.4, Gemini 3과의 비교와 실전 활용법까지.
AI
LLM 구조화된 출력 — JSON Mode와 Schema 제약
LLM에서 JSON, 구조화된 데이터를 안정적으로 추출하는 기법과 패턴.