본문 바로가기
🤖

AI 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

A2A👁 130
Agent-to-Agent Protocol
에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.
Accuracy👁 130
전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.
PII Redaction👁 125
LLM 프롬프트·로그에서 개인정보 자동 마스킹.
Top-p👁 123
Nucleus Sampling
누적 확률 p 이하의 토큰 후보만 남기고 그 중에서 샘플링하는 방식. 품질과 다양성 균형에 유리.
Agentic RAG👁 122
LLM이 검색 여부·범위·재검색을 스스로 판단하는 RAG. 도구 사용과 결합.
Activation Function👁 121
신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.
멀티 에이전트 오케스트레이션👁 112
Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.
추론 지연 최적화👁 110
TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.
청킹 전략 상세👁 106
고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.
유명 MCP 서버👁 103
filesystem·git·slack·github·notion·postgres MCP 서버.
LLM Gateway👁 100
여러 LLM 제공자를 통일된 API·거버넌스로 관리. Portkey·LiteLLM·OpenRouter.
AGI👁 89
Artificial General Intelligence
인간 수준의 범용 지능을 가진 AI. 특정 태스크가 아닌 모든 인지 작업을 수행 가능한 가상적 목표.
MCP👁 88
Model Context Protocol
AI 에이전트와 외부 도구·데이터를 연결하는 표준 프로토콜. Anthropic이 제안, 업계 확산 중.
Adam👁 87
적응형 학습률 + 모멘텀을 결합한 최적화 알고리즘. 딥러닝 실무의 표준 선택.
Embedding👁 85
임베딩
텍스트·이미지 같은 비정형 데이터를 고차원 벡터(숫자 배열)로 변환한 표현. 의미가 비슷하면 벡터도 가깝다.
System 2 Thinking (LLM)👁 84
직관적 즉답(System 1)과 달리 오래 숙고하는 추론. Reasoning 모델의 설계 철학.
Vibe Coding👁 84
AI에게 자연어로 지시해 대부분의 코드를 만드는 방식. Andrej Karpathy가 명명.
RAG👁 82
Retrieval-Augmented Generation
LLM에 외부 지식을 주입해 답변 품질을 높이는 표준 패턴. 질문 → 벡터 검색 → 관련 문서 → 프롬프트에 포함 → LLM 생성.
Decoder-only Transformer👁 81
GPT·Llama 같은 생성 LLM의 기반 아키텍처. 인코더 없이 디코더만 사용.
LLM 생태계 지도👁 80
2026 LLM 스택: 모델 API·로컬 런타임·프레임워크·벡터DB·에이전트 플랫폼.
Object Detection👁 80
이미지 내 객체의 위치(bbox)와 클래스를 동시에 예측하는 CV 작업.
Outlines / Structured Generation👁 80
문법·스키마·정규식에 맞는 출력을 강제 생성. logit biasing.
LLM👁 79
Large Language Model
대규모 텍스트로 학습된 대형 언어 모델. GPT, Claude, Gemini 등이 대표적.
MCP Server👁 79
Model Context Protocol 서버 구현. LLM에 도구·리소스를 제공.
Token👁 79
토큰
LLM이 텍스트를 처리하는 최소 단위. 한글은 대략 1글자 ≈ 1~2 토큰, 영어는 1단어 ≈ 1.3 토큰.
Vector Database👁 79
벡터 데이터베이스
벡터 임베딩을 저장하고 코사인 유사도 등으로 빠르게 최근접 검색하는 DB. Pinecone·Weaviate·Qdrant·pgvector·Redis 8 등.
AI Agent👁 78
AI 에이전트
LLM이 도구 호출·작업 분해·상태 유지를 통해 자율적으로 목표를 수행하는 시스템. 2026년 핫 키워드.
LLM Seed👁 78
랜덤 시드 고정으로 재현 가능한 응답. 테스트·디버그.
Transformer👁 78
트랜스포머
2017년 Google이 발표한 "Attention is All You Need" 논문의 신경망 아키텍처. 현대 LLM의 기반.
Distillation👁 77
Knowledge Distillation
큰 모델(teacher)의 출력을 작은 모델(student)이 따라 하도록 학습시켜 성능을 최대한 유지하며 크기를 줄이는 기법.
Fine-tuning👁 77
파인튜닝
사전 학습된 모델을 자체 데이터로 추가 학습해 특정 도메인·스타일에 맞추는 기법.
Groq👁 77
LPU(Language Processing Unit) ASIC으로 초고속 LLM 추론. 토큰/초 1000+.
Hugging Face Hub👁 77
수십만 AI 모델·데이터셋·Spaces(앱) 호스팅 플랫폼. "AI의 GitHub".
Prompt Engineering👁 77
프롬프트 엔지니어링
LLM에게 원하는 출력을 끌어내기 위한 지시문 설계 기술. Few-shot·CoT·role prompting 등 패턴이 존재한다.
RNN👁 77
Recurrent Neural Network
시퀀스 데이터에 재귀적으로 상태를 전달하는 신경망. Transformer에 밀린 역사적 모델.
Contextual Retrieval👁 76
Anthropic이 제안한 RAG 개선. 각 청크에 문서 맥락을 덧붙여 임베딩.
Hallucination👁 76
환각
LLM이 사실이 아닌 내용을 그럴듯하게 생성하는 현상. RAG·툴 사용·체크 루프로 완화 가능.
LightGBM👁 76
Microsoft의 Gradient Boosting. XGBoost보다 빠르고 메모리 효율적.
AI Alignment👁 75
AI 시스템이 인간 의도·가치에 부합하게 동작하도록 만드는 연구 분야.
Attention👁 74
Attention Mechanism
시퀀스 내 토큰들이 서로를 참조하며 중요도(가중치)를 학습하는 메커니즘. Transformer의 핵심.
Context Window👁 74
컨텍스트 윈도우
LLM이 한 번에 처리할 수 있는 최대 토큰 수. Claude Opus 4.7은 200K~1M, Gemini는 최대 2M.
GPT👁 74
Generative Pre-trained Transformer
OpenAI가 개발한 대규모 자기회귀 LLM 시리즈. GPT-3, 3.5, 4, 5.4로 이어지며 LLM 시대를 열었다.
Inference👁 74
추론
학습된 모델이 새 입력에 대해 출력을 생성하는 과정. 학습(training)과 구분되는 운영 단계.
Multimodal👁 74
멀티모달
텍스트·이미지·음성·영상 등 여러 종류의 입력을 함께 처리하는 모델. GPT-4o, Claude Opus, Gemini가 대표적.
Quantization👁 74
양자화
모델 가중치의 정밀도를 낮춰(예: 16bit → 4bit) 메모리·속도를 개선하는 기법. 로컬 LLM 구동의 핵심.
Claude Mythos👁 73
Anthropic이 2026년 4월 공개한 사이버보안 특화 LLM 클래스. 취약점 탐지·대규모 코드 분석·공격 체인 추론에 특화.
Instructor👁 73
OpenAI·Anthropic을 Pydantic 모델로 응답 받는 Python 라이브러리.
BERT👁 72
Bidirectional Encoder Representations from Transformers
Google이 2018년 공개한 양방향 Transformer 인코더. 분류·검색·임베딩에 강점, 현재도 NLP 백본으로 활약.
Chain-of-Thought👁 72
CoT (생각의 사슬)
LLM이 최종 답 이전에 단계별 추론 과정을 명시적으로 서술하게 유도하는 프롬프트 기법. 수학·논리 문제에서 정확도를 크게 높인다.
Claude Code👁 72
Anthropic의 터미널 기반 AI 코딩 에이전트. 저장소 전체 리팩터링·테스트·PR 작성에 강점.