TECH NOTES
기술노트
현장에서 검증된 개발 지식을 기록합니다.
654321
AI
Anthropic Claude 4.9 출시 — 100시간 사용 평가
Claude 4.9 (Opus·Sonnet·Haiku) 출시 후 100시간 사용 평가. SWE-bench 82.1%, 1M needle 정확도, 가격 정책 변화.
AI
Claude Opus 5 1M 컨텍스트 — 실측 200K 이후 정확도 곡선
1M 토큰 윈도우의 진짜 한계는 200K 이후 needle-in-haystack 정확도. 자사 코드베이스 7개 실측, 캐싱·청킹 전략 정리.
Backend
NestJS 12 vs Hono 4 — 마이크로서비스 실부하 테스트 2026
NestJS 12의 새 컴파일러 + Hono 4 비교. 콜드 스타트, 처리량, DX, 마이그레이션 비용 측정.
AI
Gemini 3 Code Assist vs Claude Code — 실제 코드베이스 100태스크 비교
Gemini 3 Code Assist GA와 Claude Code를 동일 모노레포 100 태스크로 비교. 성공률, 비용, 토큰 효율, 멀티파일 편집 정확도 실측.
AI
Sonnet 4.7 코딩 벤치마크 — 사내 코드베이스 100문제 실측
SWE-bench 같은 표준 벤치 말고, 사내 실제 코드에서 100문제 골라 Claude Sonnet 4.7 vs Opus 4.7 vs GPT-5.5 비교.
AI
GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro 실전 비교 — 코드·분석·창작
2026년 4월 기준 프런티어 LLM 3종을 코드 작성·문서 분석·창작·비용 4개 영역에서 직접 비교. 실측 결과로 보는 작업별 최적 모델.