TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
1615141312111098765
AI
Snowflake Cortex Search vs Pinecone — RAG 검색 엔진 비교 12주
Snowflake Cortex Search GA. Pinecone과 같은 코퍼스 1.2M 문서로 12주 운영 비교. 정확도 동일, 비용 -68%, 운영 부담 1/4.
AI
Cloudflare Workers AI에 RAG — vector + KV + R2로 만든 검색봇
Workers AI + Vectorize + KV + R2로 만든 사내 검색봇. 월 비용 $14, p50 응답 320ms, 6개월 운영 정리.
DB
Elasticsearch 9 — Elastic Inference 임베딩 + BM25 하이브리드
ES 9의 Elastic Inference로 임베딩 자동 생성 + BM25 결합 하이브리드 검색. 사내 검색 NDCG +18%.
DB
Redis 8.0 vector search — RediSearch 통합 후 RAG 5배 빠른 이유
Redis 8.0이 vector + full-text 통합 native. RAG 파이프라인 pgvector→Redis 전환 6개월, 검색 5배.
AI
Perplexity 스타일 검색 파이프라인 — 0에서 만드는 RAG+웹검색 통합
질문 분류, 다중 소스 검색, 인용 추출, 스트리밍 답변까지. Perplexity 같은 답변형 검색을 직접 구축하는 7단계 가이드.
AI
RAG가 망가지는 5가지 패턴 — 청킹·리랭킹·하이브리드 검색 실전 해법
RAG가 "그럴듯하지만 틀린 답"을 내는 5가지 원인과 실전 해법. 청킹·리랭킹·하이브리드·메타필터·도메인 임베딩.
AI
Embedding 모델 2026 비교 — OpenAI v3·Cohere v4·Voyage·bge-m3·solar
2026년 4월 임베딩 모델 5종 종합 비교 — OpenAI v3-large, Cohere embed-multilingual-v4, Voyage 3, bge-m3, solar-embedding. 한국어·다국어·도메인별 추천.
AI
pgvector 0.10 vs Qdrant vs Pinecone vs Milvus — 2026 Vector DB 비교
2026년 4월 기준 Vector DB 4강 비교 — 비용·성능·운영 부담·통합. RAG 시스템 규모별 선택 가이드.
AI
RAG 시스템 한국어 청킹 전략 — kss·KoNLPy + Late Chunking 실전
RAG 정확도를 결정하는 청킹 — 한국어 특성을 살린 kss 문장 분리, Late Chunking, recursive split 조합으로 recall@10을 0.7에서 0.9 이상으로 끌어올린 실전.
AI
RAG(Retrieval-Augmented Generation) 실전 구축 가이드 — 벡터DB 선택부터 청크 전략까지
RAG는 LLM에 외부 지식을 주입하는 표준 패턴이다. 청크 전략·임베딩 선택·벡터DB·리랭킹·평가 지표까지 실전 설계 기준을 정리한다.
AI
RAG 심화 — 청킹과 리랭킹 전략
RAG 파이프라인의 핵심인 문서 청킹 전략과 검색 결과 리랭킹 기법을 비교 분석하고 최적 조합을 찾는 방법을 다룹니다.
AI
ChromaDB 벡터 검색 — Python으로 시맨틱 검색 구축
ChromaDB를 활용하여 텍스트 임베딩 기반의 시맨틱 검색 시스템을 Python으로 구축하고, RAG 파이프라인에 통합하는 방법을 다룹니다.