🤖
AI — 427개 용어
LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어
RLAIF👁 53
Reinforcement Learning from AI Feedback
AI가 평가자 역할을 해 사람 라벨을 대체. RLHF의 비용 대안.
Zero-shot CoT👁 53
"단계별로 생각해줘" 한 줄만으로 추론 성능 향상.
Best-of-N Sampling👁 52
N개 응답을 생성 후 최고를 선택. 단순하지만 효과적인 inference scaling.
Code Interpreter👁 52
LLM이 Python을 실행·결과를 관찰. ChatGPT Advanced Data Analysis.
Llama Guard👁 52
Meta의 안전성 분류 모델. 입력·출력을 categorize.
Ollama Modelfile👁 52
Ollama의 커스텀 모델 정의 파일. Dockerfile 유사.
OpenAI Moderation API👁 52
OpenAI의 무료 유해성 분류 API. 사용자 입력 필터링.
OpenAI Responses API👁 52
Assistants·Chat 통합 후속 API. stateful·tools.
OpenAI Responses API👁 52
OpenAI의 통합 응답 API. Chat Completion·Assistants 대체.
Overfitting👁 52
학습 데이터에 과도하게 맞춰져 새 데이터에서 성능이 떨어지는 현상.
Program of Thoughts👁 52
PoT
추론을 코드로 표현·실행. 수학·계산 정확도 향상.
Qwen👁 52
알리바바의 오픈소스 LLM 시리즈. 중국어·다국어 성능이 뛰어나며 코딩 특화 Qwen-Coder도 인기.
ROUGE👁 52
요약 품질 지표. Recall 기반 n-gram·LCS.
SigLIP👁 52
Google의 CLIP 개선판. Sigmoid loss로 효율적 학습.
Sora👁 52
OpenAI의 text-to-video 모델. 최대 분 단위 고품질 영상 생성.
Stop Tokens👁 52
생성 중단 문자열 지정. 특정 패턴 만나면 출력 멈춤.
SWE-bench👁 52
GitHub 이슈를 자동 수정하는 에이전트 벤치마크. 가장 권위 있음.
Teacher-Student Distillation👁 52
강한 큰 모델의 출력으로 작은 모델을 학습. 비용·지연 개선.
Together AI👁 52
오픈 모델 추론 플랫폼. 저비용·fine-tuning.
Vertex AI👁 52
Google Cloud의 관리형 AI 플랫폼. Gemini·PaLM·오픈모델 통합.
Agentic Chunking👁 51
LLM이 문서를 의미 단위로 직접 분할. 고비용·고품질.
Agent Memory👁 51
단기·장기 메모리. Conversation buffer·Vector store·Summary.
Agent Reflection👁 51
에이전트가 자신의 출력을 자기 평가·개선하는 루프.
Cerebras👁 51
WSE(Wafer Scale Engine) 거대 칩으로 LLM 학습·추론. 세계 최대 AI 칩.
Claude Projects👁 51
프로젝트 단위 지식·지침 공유. 긴 컨텍스트·팀 공유.
Context Stuffing👁 51
많은 예제·문서를 컨텍스트에 밀어 넣는 전략. Long Context 시대에 재부상.
Delimiters👁 51
프롬프트 섹션을 구분자로 명확화. <input>·```·---.
Groq LPU👁 51
Groq의 Language Processing Unit. 초당 수백 토큰 추론.
Jamba👁 51
AI21의 Transformer+Mamba 하이브리드 모델. 256K 컨텍스트.
Kimi K2👁 51
Moonshot AI의 에이전틱 오픈 모델. 1T 파라미터 MoE.
LangGraph State👁 51
LangGraph의 상태 머신. 노드·엣지·체크포인터로 복잡 에이전트.
Least-to-Most Prompting👁 51
어려운 문제를 쉬운 하위 문제로 분해·순차 해결.
LLM 프롬프트 보안👁 51
시스템 프롬프트 유출 방지·역할 고정·탈옥 저항.
LLM + MCTS👁 51
Monte Carlo Tree Search로 추론 트리 탐색. AlphaZero식 탐색 + LLM.
Long Context 함정👁 51
Lost in the Middle·지연 증가·비용 선형 상승.
Mixture of Agents👁 51
MoA
여러 LLM의 응답을 종합해 최종 답변 생성. Together AI가 제안.
Multimodal Embedding👁 51
이미지·텍스트·오디오를 같은 벡터 공간에. CLIP·SigLIP.
OpenAI o1👁 51
OpenAI의 추론 특화 모델(2024.09). Chain-of-Thought 내장.
OpenAI Realtime API👁 51
양방향 음성·텍스트 스트리밍. WebRTC·SSE.
PagedAttention👁 51
vLLM의 KV Cache 페이지 단위 관리. 메모리 효율 극대.
Replicate👁 51
GitHub 커밋만으로 ML 모델 배포. 커뮤니티 모델 풍부.
Role Prompting👁 51
"당신은 전문가다" 역할 부여. 응답 스타일·품질 향상.
SGLang👁 51
vLLM 대안 고성능 LLM 서빙. 복잡 제어 플로우에 강점.
Sliding Window Attention👁 51
Transformer의 attention을 지역 윈도우로 제한해 긴 컨텍스트 처리 비용을 줄이는 기법.
Supervisor Agent Pattern👁 51
상위 에이전트가 전문 하위 에이전트에 라우팅·결과 집계.
Whisper API👁 51
OpenAI의 Whisper 클라우드 API. 파일 업로드·실시간 자막.
Epoch👁 50
전체 학습 데이터를 한 번 통과하는 단위. 일반적으로 여러 에폭 학습.
Fireworks AI👁 50
고속 오픈 모델 추론. FireAttention 엔진.
Google DeepMind👁 50
Google의 AI 연구 조직. AlphaGo·Gemini·Gemma·AlphaFold로 유명.
LlamaIndex Query Engine👁 50
LlamaIndex의 RAG 쿼리 엔진. Retrieval·Synthesis 자동.