기술노트 — AI·풀스택·인프라 실전 개발 지식 | 영삼넷

본문 바로가기

LLM 컨텍스트 윈도우 — 길다고 다 좋은 게 아니다

컨텍스트 윈도우가 크면 다 넣으면 될까? "중간을 잊는" 현상과 비용·지연 때문에 무작정 채우면 오히려 답이 나빠진다. 제대로 쓰는 법.

#LLM#Context#Prompt

LLM 환각(hallucination) 줄이는 실전 방법

모델은 모르는 것도 자신 있게 지어낸다. 근거 제공(RAG)·"모르면 모른다"·출력 구조화·검증으로 환각을 억제한다.

#LLM#Hallucination#RAG

임베딩 모델과 벡터DB 선택 기준

차원·다국어·비용·도메인 적합도로 임베딩을 고르고, 규모·필터·운영 부담으로 벡터DB를 고른다. 과한 인프라를 피하는 법.

#Embedding#VectorDB#RAG

RAG 검색 품질이 낮을 때 — 청킹부터 다시

RAG가 엉뚱한 답을 하면 대개 검색 단계가 문제다. 청크 크기·오버랩·메타데이터·하이브리드 검색·리랭킹으로 적합도를 올린다.

#RAG#LLM#Embedding

Snowflake Cortex Search vs Pinecone — RAG 검색 엔진 비교 12주

Snowflake Cortex Search GA. Pinecone과 같은 코퍼스 1.2M 문서로 12주 운영 비교. 정확도 동일, 비용 -68%, 운영 부담 1/4.

#Snowflake#Cortex#Pinecone

Cloudflare Workers AI에 RAG — vector + KV + R2로 만든 검색봇

Workers AI + Vectorize + KV + R2로 만든 사내 검색봇. 월 비용 $14, p50 응답 320ms, 6개월 운영 정리.

#Cloudflare#RAG#Vectorize

Elasticsearch 9 — Elastic Inference 임베딩 + BM25 하이브리드

ES 9의 Elastic Inference로 임베딩 자동 생성 + BM25 결합 하이브리드 검색. 사내 검색 NDCG +18%.

#Elasticsearch#Search#Embedding

Redis 8.0 vector search — RediSearch 통합 후 RAG 5배 빠른 이유

Redis 8.0이 vector + full-text 통합 native. RAG 파이프라인 pgvector→Redis 전환 6개월, 검색 5배.

#Redis#Vector#RAG

Perplexity 스타일 검색 파이프라인 — 0에서 만드는 RAG+웹검색 통합

질문 분류, 다중 소스 검색, 인용 추출, 스트리밍 답변까지. Perplexity 같은 답변형 검색을 직접 구축하는 7단계 가이드.

#RAG#Search#Citation

RAG가 망가지는 5가지 패턴 — 청킹·리랭킹·하이브리드 검색 실전 해법

RAG가 "그럴듯하지만 틀린 답"을 내는 5가지 원인과 실전 해법. 청킹·리랭킹·하이브리드·메타필터·도메인 임베딩.

#RAG#Embedding#Reranking

Embedding 모델 2026 비교 — OpenAI v3·Cohere v4·Voyage·bge-m3·solar

2026년 4월 임베딩 모델 5종 종합 비교 — OpenAI v3-large, Cohere embed-multilingual-v4, Voyage 3, bge-m3, solar-embedding. 한국어·다국어·도메인별 추천.

#Embedding#RAG#NLP

pgvector 0.10 vs Qdrant vs Pinecone vs Milvus — 2026 Vector DB 비교

2026년 4월 기준 Vector DB 4강 비교 — 비용·성능·운영 부담·통합. RAG 시스템 규모별 선택 가이드.

#VectorDB#pgvector#Qdrant