기술노트 — AI·풀스택·인프라 실전 개발 지식 | 영삼넷

본문 바로가기

Anthropic Claude 4.9 출시 — 100시간 사용 평가

Claude 4.9 (Opus·Sonnet·Haiku) 출시 후 100시간 사용 평가. SWE-bench 82.1%, 1M needle 정확도, 가격 정책 변화.

#Claude#Anthropic#LLM

Claude Opus 5 1M 컨텍스트 — 실측 200K 이후 정확도 곡선

1M 토큰 윈도우의 진짜 한계는 200K 이후 needle-in-haystack 정확도. 자사 코드베이스 7개 실측, 캐싱·청킹 전략 정리.

#Claude#LLM#Context

Backend3분 읽기

NestJS 12 vs Hono 4 — 마이크로서비스 실부하 테스트 2026

NestJS 12의 새 컴파일러 + Hono 4 비교. 콜드 스타트, 처리량, DX, 마이그레이션 비용 측정.

#NestJS#Hono#Microservice

Gemini 3 Code Assist vs Claude Code — 실제 코드베이스 100태스크 비교

Gemini 3 Code Assist GA와 Claude Code를 동일 모노레포 100 태스크로 비교. 성공률, 비용, 토큰 효율, 멀티파일 편집 정확도 실측.

#Gemini#ClaudeCode#Benchmark

Sonnet 4.7 코딩 벤치마크 — 사내 코드베이스 100문제 실측

SWE-bench 같은 표준 벤치 말고, 사내 실제 코드에서 100문제 골라 Claude Sonnet 4.7 vs Opus 4.7 vs GPT-5.5 비교.

#Claude#Benchmark#Coding

GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro 실전 비교 — 코드·분석·창작

2026년 4월 기준 프런티어 LLM 3종을 코드 작성·문서 분석·창작·비용 4개 영역에서 직접 비교. 실측 결과로 보는 작업별 최적 모델.

#LLM#GPT#Claude