본문 바로가기
🤖

AI 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

Few-shot Learning👁 72
몇 개(보통 1~10개)의 예시만 제공해 모델이 새 작업을 수행하게 하는 방식. 파인튜닝 없이 in-context 학습.
LoRA👁 71
Low-Rank Adaptation
대형 모델 전체가 아닌 작은 어댑터 행렬만 학습해 메모리·시간을 크게 절감하는 파인튜닝 기법.
MCP Prompts👁 71
MCP Prompts 프리미티브. 재사용 가능한 워크플로 템플릿.
ASR👁 70
Automatic Speech Recognition
음성을 텍스트로 변환하는 기술. Whisper·Google Speech·Azure 등.
Diffusion Model👁 70
확산 모델
노이즈에서 점진적으로 이미지를 복원하는 방식의 생성 모델. DALL-E, Stable Diffusion, Midjourney의 기반.
Pipeline Parallelism👁 69
대형 모델을 여러 GPU에 레이어 단위로 분할. Megatron·PaLM 학습에 사용.
DPO👁 68
Direct Preference Optimization
RLHF의 단순·안정적 대안. 보상 모델 없이 선호도 데이터로 직접 최적화.
OpenCV👁 68
Intel이 시작한 컴퓨터 비전 오픈소스 라이브러리. C++·Python 등 지원.
Long Context👁 67
수십만~수백만 토큰을 한 번에 처리하는 LLM 능력. 2024년 이후 경쟁 포인트.
Tokens per Second👁 67
TPS
LLM 추론 속도 지표. 초당 생성하는 토큰 수. 사용자 체감 중요 요소.
Vision OCR👁 67
GPT-4V·Claude Vision·Gemini로 이미지에서 텍스트 추출. 기존 OCR 대체.
Context Engineering👁 65
프롬프트보다 넓은 개념. 검색·도구·메모리까지 포괄한 LLM 컨텍스트 설계.
TensorRT👁 65
NVIDIA의 GPU 추론 가속 라이브러리. 모델 최적화·양자화로 수 배 빠른 서빙.
GSM8K👁 64
초등·중등 수학 문제 8.5K. Reasoning 모델 평가의 기본.
HyDE👁 64
Hypothetical Document Embeddings
질문 임베딩 대신 LLM이 생성한 가상 답변을 임베딩해 검색. 품질 향상 기법.
Self-Consistency👁 64
같은 질문을 여러 번 샘플링하고 다수결로 답 선택. 추론 정확도 향상.
Sentiment Analysis👁 64
텍스트의 감정(긍정·부정·중립)을 분류하는 NLP 작업. 리뷰·소셜 분석에 활용.
Zero-shot Learning👁 64
학습 단계에서 본 적 없는 작업을 예시 없이 바로 수행하는 능력. 대형 LLM의 핵심 역량.
Batch API (LLM)👁 63
OpenAI·Anthropic의 비동기 배치 처리. 50% 저렴, 24시간 내 완료.
Confusion Matrix👁 63
분류 결과를 TP·TN·FP·FN 4분면으로 정리한 표. 성능 분석의 기본.
Continual Learning👁 63
모델을 계속 새 데이터로 학습시키되 이전 지식을 잊지 않게 하는 연구 분야.
GPU👁 63
Graphics Processing Unit
그래픽·딥러닝 연산을 병렬 처리하는 프로세서. NVIDIA CUDA가 AI 표준.
Knowledge Graph👁 62
엔티티와 관계를 그래프로 표현한 지식 베이스. LLM과 결합해 정확도 향상.
MCP Inspector👁 62
MCP 서버 개발·디버깅 도구. 공식 웹 기반 inspector.
MCP Transport👁 62
MCP 통신 방식. stdio (로컬)와 SSE/WebSocket (원격).
PPO👁 62
Proximal Policy Optimization
OpenAI가 제안한 강화학습 알고리즘. RLHF의 전통적 선택.
Replicate👁 62
Docker 이미지 기반 AI 모델 서빙 플랫폼. 커뮤니티 모델 수천 개.
Temperature👁 62
온도 (샘플링)
LLM 샘플링 시 출력 무작위성을 조절하는 파라미터. 0이면 결정적, 1 이상이면 창의적·예측 불가.
Tree of Thoughts👁 62
CoT를 트리로 확장. 여러 경로를 탐색·평가·가지치기. 복잡 추론에 강함.
Eval Harness👁 61
LLM을 표준 벤치마크로 자동 평가하는 프레임워크. lm-eval-harness가 대표.
LangChain👁 61
LLM 애플리케이션 프레임워크. 체인·에이전트·RAG 추상화를 빠르게 구현.
lattice👁 61
OpenAI·Anthropic 출신이 만든 로컬 전용 오픈소스 코딩 에이전트. 외부 API 호출 없이 로컬 모델만 사용.
Prompt Compression👁 61
긴 프롬프트를 압축해 토큰·비용 절감. LLMLingua·요약 사전처리.
TTFT👁 61
Time To First Token
LLM이 첫 토큰을 반환하기까지 지연. 체감 반응성의 핵심.
ZeRO👁 61
Zero Redundancy Optimizer
DeepSpeed의 메모리 최적화. 옵티마이저 상태·그래디언트·파라미터를 GPU에 분산.
Data Augmentation👁 60
원본 데이터를 변형·합성해 학습 데이터를 늘리는 기법. 이미지·텍스트·오디오 전반.
Giskard👁 60
LLM·ML 모델 테스트·Red Team 오픈소스. 편향·환각·보안 검증.
kNN👁 60
k-Nearest Neighbors
새 데이터의 가장 가까운 k개 이웃의 라벨로 분류하는 알고리즘.
Llama👁 60
Meta의 오픈소스 LLM 시리즈. 연구용에서 상업 라이선스 모델로 진화. 로컬 LLM 생태계의 중심.
Perplexity👁 60
언어 모델의 불확실성 지표. 낮을수록 좋음. 사전학습 평가의 핵심.
ReAct Pattern👁 60
Reason + Act 패턴. LLM이 "생각 → 행동 → 관찰"을 반복하며 도구 사용.
RLHF👁 60
Reinforcement Learning from Human Feedback
사람의 선호도로 보상 모델을 학습하고, 이를 강화학습으로 LLM에 주입해 "사람이 좋아하는" 응답을 생성하게 하는 기법.
smolagents👁 60
Hugging Face의 초경량 코드 에이전트. 수백 줄로 agent 구현.
Stability AI👁 60
Stable Diffusion 공개사. 오픈 이미지·오디오·비디오 생성 모델.
병렬 Tool Use👁 60
하나의 응답에서 여러 도구를 동시에 호출해 지연 단축.
Underfitting👁 60
모델이 데이터 패턴을 제대로 학습하지 못한 상태. 학습 정확도 자체가 낮음.
vLLM👁 60
UC Berkeley의 고성능 LLM 추론 엔진. PagedAttention으로 메모리·처리량 극대화.
XGBoost👁 60
Gradient Boosting의 최적화 구현. 테이블 데이터 Kaggle 우승의 공식.
AI Watermarking👁 59
AI 생성 콘텐츠에 감지 가능한 표식. SynthID(Google)·C2PA.
DALL·E👁 59
OpenAI의 text-to-image 모델. DALL·E 3가 ChatGPT에 내장되어 대중화.