본문 바로가기

🤖

AI — 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

Few-shot Learning👁 72

몇 개(보통 1~10개)의 예시만 제공해 모델이 새 작업을 수행하게 하는 방식. 파인튜닝 없이 in-context 학습.

Low-Rank Adaptation

대형 모델 전체가 아닌 작은 어댑터 행렬만 학습해 메모리·시간을 크게 절감하는 파인튜닝 기법.

MCP Prompts👁 71

MCP Prompts 프리미티브. 재사용 가능한 워크플로 템플릿.

Automatic Speech Recognition

음성을 텍스트로 변환하는 기술. Whisper·Google Speech·Azure 등.

Diffusion Model👁 70

노이즈에서 점진적으로 이미지를 복원하는 방식의 생성 모델. DALL-E, Stable Diffusion, Midjourney의 기반.

Pipeline Parallelism👁 69

대형 모델을 여러 GPU에 레이어 단위로 분할. Megatron·PaLM 학습에 사용.

Direct Preference Optimization

RLHF의 단순·안정적 대안. 보상 모델 없이 선호도 데이터로 직접 최적화.

Intel이 시작한 컴퓨터 비전 오픈소스 라이브러리. C++·Python 등 지원.

Long Context👁 67

수십만~수백만 토큰을 한 번에 처리하는 LLM 능력. 2024년 이후 경쟁 포인트.

Tokens per Second👁 67

LLM 추론 속도 지표. 초당 생성하는 토큰 수. 사용자 체감 중요 요소.

Vision OCR👁 67

GPT-4V·Claude Vision·Gemini로 이미지에서 텍스트 추출. 기존 OCR 대체.

Context Engineering👁 65

프롬프트보다 넓은 개념. 검색·도구·메모리까지 포괄한 LLM 컨텍스트 설계.

TensorRT👁 65

NVIDIA의 GPU 추론 가속 라이브러리. 모델 최적화·양자화로 수 배 빠른 서빙.

초등·중등 수학 문제 8.5K. Reasoning 모델 평가의 기본.

Hypothetical Document Embeddings

질문 임베딩 대신 LLM이 생성한 가상 답변을 임베딩해 검색. 품질 향상 기법.

Self-Consistency👁 64

같은 질문을 여러 번 샘플링하고 다수결로 답 선택. 추론 정확도 향상.

Sentiment Analysis👁 64

텍스트의 감정(긍정·부정·중립)을 분류하는 NLP 작업. 리뷰·소셜 분석에 활용.

Zero-shot Learning👁 64

학습 단계에서 본 적 없는 작업을 예시 없이 바로 수행하는 능력. 대형 LLM의 핵심 역량.

Batch API (LLM)👁 63

OpenAI·Anthropic의 비동기 배치 처리. 50% 저렴, 24시간 내 완료.

Confusion Matrix👁 63

분류 결과를 TP·TN·FP·FN 4분면으로 정리한 표. 성능 분석의 기본.

Continual Learning👁 63

모델을 계속 새 데이터로 학습시키되 이전 지식을 잊지 않게 하는 연구 분야.

Graphics Processing Unit

그래픽·딥러닝 연산을 병렬 처리하는 프로세서. NVIDIA CUDA가 AI 표준.

Knowledge Graph👁 62

엔티티와 관계를 그래프로 표현한 지식 베이스. LLM과 결합해 정확도 향상.

MCP Inspector👁 62

MCP 서버 개발·디버깅 도구. 공식 웹 기반 inspector.

MCP Transport👁 62

MCP 통신 방식. stdio (로컬)와 SSE/WebSocket (원격).

Proximal Policy Optimization

OpenAI가 제안한 강화학습 알고리즘. RLHF의 전통적 선택.

Replicate👁 62

Docker 이미지 기반 AI 모델 서빙 플랫폼. 커뮤니티 모델 수천 개.

Temperature👁 62

온도 (샘플링)

LLM 샘플링 시 출력 무작위성을 조절하는 파라미터. 0이면 결정적, 1 이상이면 창의적·예측 불가.

Tree of Thoughts👁 62

CoT를 트리로 확장. 여러 경로를 탐색·평가·가지치기. 복잡 추론에 강함.

Eval Harness👁 61

LLM을 표준 벤치마크로 자동 평가하는 프레임워크. lm-eval-harness가 대표.

LangChain👁 61

LLM 애플리케이션 프레임워크. 체인·에이전트·RAG 추상화를 빠르게 구현.

OpenAI·Anthropic 출신이 만든 로컬 전용 오픈소스 코딩 에이전트. 외부 API 호출 없이 로컬 모델만 사용.

Prompt Compression👁 61

긴 프롬프트를 압축해 토큰·비용 절감. LLMLingua·요약 사전처리.

Time To First Token

LLM이 첫 토큰을 반환하기까지 지연. 체감 반응성의 핵심.

Zero Redundancy Optimizer

DeepSpeed의 메모리 최적화. 옵티마이저 상태·그래디언트·파라미터를 GPU에 분산.

Data Augmentation👁 60

원본 데이터를 변형·합성해 학습 데이터를 늘리는 기법. 이미지·텍스트·오디오 전반.

LLM·ML 모델 테스트·Red Team 오픈소스. 편향·환각·보안 검증.

k-Nearest Neighbors

새 데이터의 가장 가까운 k개 이웃의 라벨로 분류하는 알고리즘.

Meta의 오픈소스 LLM 시리즈. 연구용에서 상업 라이선스 모델로 진화. 로컬 LLM 생태계의 중심.

Perplexity👁 60

언어 모델의 불확실성 지표. 낮을수록 좋음. 사전학습 평가의 핵심.

ReAct Pattern👁 60

Reason + Act 패턴. LLM이 "생각 → 행동 → 관찰"을 반복하며 도구 사용.

Reinforcement Learning from Human Feedback

사람의 선호도로 보상 모델을 학습하고, 이를 강화학습으로 LLM에 주입해 "사람이 좋아하는" 응답을 생성하게 하는 기법.

smolagents👁 60

Hugging Face의 초경량 코드 에이전트. 수백 줄로 agent 구현.

Stability AI👁 60

Stable Diffusion 공개사. 오픈 이미지·오디오·비디오 생성 모델.

병렬 Tool Use👁 60

하나의 응답에서 여러 도구를 동시에 호출해 지연 단축.

Underfitting👁 60

모델이 데이터 패턴을 제대로 학습하지 못한 상태. 학습 정확도 자체가 낮음.

UC Berkeley의 고성능 LLM 추론 엔진. PagedAttention으로 메모리·처리량 극대화.

Gradient Boosting의 최적화 구현. 테이블 데이터 Kaggle 우승의 공식.

AI Watermarking👁 59

AI 생성 콘텐츠에 감지 가능한 표식. SynthID(Google)·C2PA.

OpenAI의 text-to-image 모델. DALL·E 3가 ChatGPT에 내장되어 대중화.

← 이전2 / 9다음 →