본문 바로가기

🤖

AI — 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

추론 지연 최적화👁 463

TTFT·TPS·Batching·KV Cache·Speculative·Quantization 조합.

Accuracy👁 405

전체 예측 중 맞춘 비율. 클래스 불균형 시 오해를 유발할 수 있음.

Agent-to-Agent Protocol

에이전트 간 통신 표준. Google이 제안. MCP와 상호 보완.

멀티 에이전트 오케스트레이션👁 388

Supervisor·Hierarchy·Network 패턴으로 여러 에이전트 조율.

Activation Function👁 383

신경망 뉴런의 비선형 변환. ReLU·GELU·Sigmoid·Tanh.

Nucleus Sampling

누적 확률 p 이하의 토큰 후보만 남기고 그 중에서 샘플링하는 방식. 품질과 다양성 균형에 유리.

PII Redaction👁 329

LLM 프롬프트·로그에서 개인정보 자동 마스킹.

청킹 전략 상세👁 238

고정·문장·계층·의미론적·Agentic 청킹. RAG 품질의 결정.

Agentic RAG👁 178

LLM이 검색 여부·범위·재검색을 스스로 판단하는 RAG. 도구 사용과 결합.

적응형 학습률 + 모멘텀을 결합한 최적화 알고리즘. 딥러닝 실무의 표준 선택.

LLM Gateway👁 154

여러 LLM 제공자를 통일된 API·거버넌스로 관리. Portkey·LiteLLM·OpenRouter.

유명 MCP 서버👁 154

filesystem·git·slack·github·notion·postgres MCP 서버.

Model Context Protocol

AI 에이전트와 외부 도구·데이터를 연결하는 표준 프로토콜. Anthropic이 제안, 업계 확산 중.

System 2 Thinking (LLM)👁 139

직관적 즉답(System 1)과 달리 오래 숙고하는 추론. Reasoning 모델의 설계 철학.

Artificial General Intelligence

인간 수준의 범용 지능을 가진 AI. 특정 태스크가 아닌 모든 인지 작업을 수행 가능한 가상적 목표.

Embedding👁 138

텍스트·이미지 같은 비정형 데이터를 고차원 벡터(숫자 배열)로 변환한 표현. 의미가 비슷하면 벡터도 가깝다.

Transformer👁 137

트랜스포머

2017년 Google이 발표한 "Attention is All You Need" 논문의 신경망 아키텍처. 현대 LLM의 기반.

AI Agent👁 136

AI 에이전트

LLM이 도구 호출·작업 분해·상태 유지를 통해 자율적으로 목표를 수행하는 시스템. 2026년 핫 키워드.

LLM이 텍스트를 처리하는 최소 단위. 한글은 대략 1글자 ≈ 1~2 토큰, 영어는 1단어 ≈ 1.3 토큰.

Retrieval-Augmented Generation

LLM에 외부 지식을 주입해 답변 품질을 높이는 표준 패턴. 질문 → 벡터 검색 → 관련 문서 → 프롬프트에 포함 → LLM 생성.

LLM Seed👁 133

랜덤 시드 고정으로 재현 가능한 응답. 테스트·디버그.

Vibe Coding👁 131

AI에게 자연어로 지시해 대부분의 코드를 만드는 방식. Andrej Karpathy가 명명.

Large Language Model

대규모 텍스트로 학습된 대형 언어 모델. GPT, Claude, Gemini 등이 대표적.

Vector Database👁 129

벡터 데이터베이스

벡터 임베딩을 저장하고 코사인 유사도 등으로 빠르게 최근접 검색하는 DB. Pinecone·Weaviate·Qdrant·pgvector·Redis 8 등.

Decoder-only Transformer👁 128

GPT·Llama 같은 생성 LLM의 기반 아키텍처. 인코더 없이 디코더만 사용.

Outlines / Structured Generation👁 128

문법·스키마·정규식에 맞는 출력을 강제 생성. logit biasing.

Context Window👁 127

컨텍스트 윈도우

LLM이 한 번에 처리할 수 있는 최대 토큰 수. Claude Opus 4.7은 200K~1M, Gemini는 최대 2M.

Object Detection👁 127

이미지 내 객체의 위치(bbox)와 클래스를 동시에 예측하는 CV 작업.

Recurrent Neural Network

시퀀스 데이터에 재귀적으로 상태를 전달하는 신경망. Transformer에 밀린 역사적 모델.

Tokens per Second👁 127

LLM 추론 속도 지표. 초당 생성하는 토큰 수. 사용자 체감 중요 요소.

LPU(Language Processing Unit) ASIC으로 초고속 LLM 추론. 토큰/초 1000+.

LLM 생태계 지도👁 125

2026 LLM 스택: 모델 API·로컬 런타임·프레임워크·벡터DB·에이전트 플랫폼.

Long Context👁 125

수십만~수백만 토큰을 한 번에 처리하는 LLM 능력. 2024년 이후 경쟁 포인트.

Fine-tuning👁 123

사전 학습된 모델을 자체 데이터로 추가 학습해 특정 도메인·스타일에 맞추는 기법.

Hugging Face Hub👁 123

수십만 AI 모델·데이터셋·Spaces(앱) 호스팅 플랫폼. "AI의 GitHub".

Distillation👁 122

Knowledge Distillation

큰 모델(teacher)의 출력을 작은 모델(student)이 따라 하도록 학습시켜 성능을 최대한 유지하며 크기를 줄이는 기법.

Generative Pre-trained Transformer

OpenAI가 개발한 대규모 자기회귀 LLM 시리즈. GPT-3, 3.5, 4, 5.4로 이어지며 LLM 시대를 열었다.

MCP Server👁 122

Model Context Protocol 서버 구현. LLM에 도구·리소스를 제공.

Prompt Engineering👁 122

프롬프트 엔지니어링

LLM에게 원하는 출력을 끌어내기 위한 지시문 설계 기술. Few-shot·CoT·role prompting 등 패턴이 존재한다.

Claude Code👁 121

Anthropic의 터미널 기반 AI 코딩 에이전트. 저장소 전체 리팩터링·테스트·PR 작성에 강점.

Hallucination👁 121

LLM이 사실이 아닌 내용을 그럴듯하게 생성하는 현상. RAG·툴 사용·체크 루프로 완화 가능.

Multimodal👁 121

텍스트·이미지·음성·영상 등 여러 종류의 입력을 함께 처리하는 모델. GPT-4o, Claude Opus, Gemini가 대표적.

Quantization👁 121

모델 가중치의 정밀도를 낮춰(예: 16bit → 4bit) 메모리·속도를 개선하는 기법. 로컬 LLM 구동의 핵심.

AI Alignment👁 120

AI 시스템이 인간 의도·가치에 부합하게 동작하도록 만드는 연구 분야.

Attention👁 120

Attention Mechanism

시퀀스 내 토큰들이 서로를 참조하며 중요도(가중치)를 학습하는 메커니즘. Transformer의 핵심.

Contextual Retrieval👁 120

Anthropic이 제안한 RAG 개선. 각 청크에 문서 맥락을 덧붙여 임베딩.

Inference👁 120

학습된 모델이 새 입력에 대해 출력을 생성하는 과정. 학습(training)과 구분되는 운영 단계.

Claude Mythos👁 118

Anthropic이 2026년 4월 공개한 사이버보안 특화 LLM 클래스. 취약점 탐지·대규모 코드 분석·공격 체인 추론에 특화.

Low-Rank Adaptation

대형 모델 전체가 아닌 작은 어댑터 행렬만 학습해 메모리·시간을 크게 절감하는 파인튜닝 기법.

Automatic Speech Recognition

음성을 텍스트로 변환하는 기술. Whisper·Google Speech·Azure 등.

1 / 9다음 →