본문 바로가기

🤖

AI — 427개 용어

LLM·에이전트·RAG·임베딩·프롬프트 등 AI 시대 필수 용어

Reinforcement Learning from AI Feedback

AI가 평가자 역할을 해 사람 라벨을 대체. RLHF의 비용 대안.

Zero-shot CoT👁 53

"단계별로 생각해줘" 한 줄만으로 추론 성능 향상.

Best-of-N Sampling👁 52

N개 응답을 생성 후 최고를 선택. 단순하지만 효과적인 inference scaling.

Code Interpreter👁 52

LLM이 Python을 실행·결과를 관찰. ChatGPT Advanced Data Analysis.

Llama Guard👁 52

Meta의 안전성 분류 모델. 입력·출력을 categorize.

Ollama Modelfile👁 52

Ollama의 커스텀 모델 정의 파일. Dockerfile 유사.

OpenAI Moderation API👁 52

OpenAI의 무료 유해성 분류 API. 사용자 입력 필터링.

OpenAI Responses API👁 52

Assistants·Chat 통합 후속 API. stateful·tools.

OpenAI Responses API👁 52

OpenAI의 통합 응답 API. Chat Completion·Assistants 대체.

Overfitting👁 52

학습 데이터에 과도하게 맞춰져 새 데이터에서 성능이 떨어지는 현상.

Program of Thoughts👁 52

추론을 코드로 표현·실행. 수학·계산 정확도 향상.

알리바바의 오픈소스 LLM 시리즈. 중국어·다국어 성능이 뛰어나며 코딩 특화 Qwen-Coder도 인기.

요약 품질 지표. Recall 기반 n-gram·LCS.

Google의 CLIP 개선판. Sigmoid loss로 효율적 학습.

OpenAI의 text-to-video 모델. 최대 분 단위 고품질 영상 생성.

Stop Tokens👁 52

생성 중단 문자열 지정. 특정 패턴 만나면 출력 멈춤.

SWE-bench👁 52

GitHub 이슈를 자동 수정하는 에이전트 벤치마크. 가장 권위 있음.

Teacher-Student Distillation👁 52

강한 큰 모델의 출력으로 작은 모델을 학습. 비용·지연 개선.

Together AI👁 52

오픈 모델 추론 플랫폼. 저비용·fine-tuning.

Vertex AI👁 52

Google Cloud의 관리형 AI 플랫폼. Gemini·PaLM·오픈모델 통합.

Agentic Chunking👁 51

LLM이 문서를 의미 단위로 직접 분할. 고비용·고품질.

Agent Memory👁 51

단기·장기 메모리. Conversation buffer·Vector store·Summary.

Agent Reflection👁 51

에이전트가 자신의 출력을 자기 평가·개선하는 루프.

Cerebras👁 51

WSE(Wafer Scale Engine) 거대 칩으로 LLM 학습·추론. 세계 최대 AI 칩.

Claude Projects👁 51

프로젝트 단위 지식·지침 공유. 긴 컨텍스트·팀 공유.

Context Stuffing👁 51

많은 예제·문서를 컨텍스트에 밀어 넣는 전략. Long Context 시대에 재부상.

Delimiters👁 51

프롬프트 섹션을 구분자로 명확화. <input>·```·---.

Groq LPU👁 51

Groq의 Language Processing Unit. 초당 수백 토큰 추론.

AI21의 Transformer+Mamba 하이브리드 모델. 256K 컨텍스트.

Moonshot AI의 에이전틱 오픈 모델. 1T 파라미터 MoE.

LangGraph State👁 51

LangGraph의 상태 머신. 노드·엣지·체크포인터로 복잡 에이전트.

Least-to-Most Prompting👁 51

어려운 문제를 쉬운 하위 문제로 분해·순차 해결.

LLM 프롬프트 보안👁 51

시스템 프롬프트 유출 방지·역할 고정·탈옥 저항.

LLM + MCTS👁 51

Monte Carlo Tree Search로 추론 트리 탐색. AlphaZero식 탐색 + LLM.

Long Context 함정👁 51

Lost in the Middle·지연 증가·비용 선형 상승.

Mixture of Agents👁 51

여러 LLM의 응답을 종합해 최종 답변 생성. Together AI가 제안.

Multimodal Embedding👁 51

이미지·텍스트·오디오를 같은 벡터 공간에. CLIP·SigLIP.

OpenAI o1👁 51

OpenAI의 추론 특화 모델(2024.09). Chain-of-Thought 내장.

OpenAI Realtime API👁 51

양방향 음성·텍스트 스트리밍. WebRTC·SSE.

PagedAttention👁 51

vLLM의 KV Cache 페이지 단위 관리. 메모리 효율 극대.

Replicate👁 51

GitHub 커밋만으로 ML 모델 배포. 커뮤니티 모델 풍부.

Role Prompting👁 51

"당신은 전문가다" 역할 부여. 응답 스타일·품질 향상.

vLLM 대안 고성능 LLM 서빙. 복잡 제어 플로우에 강점.

Sliding Window Attention👁 51

Transformer의 attention을 지역 윈도우로 제한해 긴 컨텍스트 처리 비용을 줄이는 기법.

Supervisor Agent Pattern👁 51

상위 에이전트가 전문 하위 에이전트에 라우팅·결과 집계.

Whisper API👁 51

OpenAI의 Whisper 클라우드 API. 파일 업로드·실시간 자막.

전체 학습 데이터를 한 번 통과하는 단위. 일반적으로 여러 에폭 학습.

Fireworks AI👁 50

고속 오픈 모델 추론. FireAttention 엔진.

Google DeepMind👁 50

Google의 AI 연구 조직. AlphaGo·Gemini·Gemma·AlphaFold로 유명.

LlamaIndex Query Engine👁 50

LlamaIndex의 RAG 쿼리 엔진. Retrieval·Synthesis 자동.

← 이전8 / 9다음 →