3시간 동안 디버깅 세션을 이어가며 겨우 재현 조건을 잡아낸 순간, 컨텍스트가 95%를 넘기면서 자동 컴팩션이 발동합니다.
/context를 한 번이라도 실행해본 개발자라면, MCP 도구가 예상보다 많은 컨텍스트를 점유하고 있다는 사실에 놀랐을 겁니다. 한 사용자의 실측 기록을 보면 MCP 도구 스키마만으로 200K 컨텍스트 윈도우의 41% — 82,000 토큰 — 가 소진되었습니다.
AI 코딩 어시스턴트가 tool call 10번을 거쳐 파일 3개를 수정했는데 결과가 이상할 때, 어디서 판단이 틀어졌는지 추적하는 게 솔직히 고역이었다. console.
Claude Code로 긴 세션을 돌려본 경험이 있다면, 한 가지 패턴을 느꼈을 겁니다. 초반에는 명쾌하게 파일을 읽고 수정하던 에이전트가, 세션이 20턴을 넘어가면서 점점 같은 파일을 다시 읽거나 이전에 확인한 내용을 잊어버리는 현상.
xAI가 코딩 에이전트 시장에 정식으로 도전장을 던졌다. 5월 14일 얼리 베타로 출시된 Grok Build는 2M 토큰 컨텍스트와 병렬 서브에이전트를 앞세운 터미널 네이티브 CLI다.
Anthropic의 공식 권장은 간결합니다. "Ruthlessly prune — Claude가 이미 올바르게 하는 것이면 삭제하거나 훅으로 바꾸세요.
Claude Code에서 모듈 마이그레이션을 시작하면 흔히 겪는 리듬이 있습니다. Opus가 코드를 고치고, 테스트를 돌리고, 실패를 발견하고, 다시 고치고 — 이 사이클을 개발자가 매 턴 "계속해"를 입력하며 감독합니다.
팀 프로젝트에 커스텀 명령을 15개 등록했는데 Claude가 절반밖에 인식하지 못하는 경험, 해보신 적 있습니까. 분명 .
Claude Agent SDK로 에이전트를 만들어 본 경험이 있다면, 한 가지 의아한 점을 느끼셨을 겁니다.
15개월 전 Anthropic의 연간 반복 매출(ARR)은 10억 달러였다. 2026년 4월 기준 300억 달러.
팀에서 CLAUDE.md를 정성스럽게 다듬고, hooks로 린트 자동화를 걸고, 커스텀 스킬 3개를 만들어서 코드 리뷰 품질이 확 올랐다고 가정합니다.
긴 세션에서 Claude Code의 응답 품질이 서서히 떨어지는 경험을 해보셨을 겁니다. 파일 10개를 읽고, 테스트를 돌리고, 리팩터링을 반복하다 보면 어느 순간 앞서 논의한 설계 결정을 잊어버리거나 같은 파일을 다시 읽기 시작합니다.
Claude Code로 복잡한 작업을 진행하다 보면 묘한 패턴을 발견하게 됩니다. 초반에는 정확하던 응답이 대화가 길어질수록 미묘하게 빗나가기 시작하고, 같은 코드베이스를 탐색하면서도 이전에 읽은 파일 내용과 현재 맥락이 뒤섞이는 현상이 나타납니다.
npm test가 반환하는 500줄의 로그를 Claude Code가 그대로 컨텍스트에 삼키는 장면을 본 적 있으실 겁니다. 테스트 결과 자체는 3줄이면 파악되지만, 나머지 497줄은 다음 행동의 판단 근거를 희석시킵니다.
Opus 4.7로 올리고 첫 주에 팀 리뷰 대시보드를 열었을 때, 의외의 숫자가 눈에 들어왔습니다.
2025년 한 해 동안 GitHub에 올라온 커밋은 10억 개였다. 지금은 주당 2.
클라우드에 배포 스크립트를 띄워놓고 결과를 기다리는 동안 Claude Code에게 "빌드 끝났는지 확인해봐"라고 반복해서 물어본 경험이 있다면, 그 과정에서 얼마나 많은 토큰이 조용히 소진되었는지 짚어볼 필요가 있습니다. 4월 9일 v2.
지난 4월 23일, Anthropic은 "An update on recent Claude Code quality reports"라는 포스트모템을 공개했습니다. 3월부터 4월 사이에 발생한 세 가지 기술적 문제를 분석한 문서인데, 그 첫 번째 원인이 의외로 단순했습니다.
Opus 4.7이 출시되고 일주일이 지났습니다.
4월 16일, OpenAI가 Codex를 대규모로 업데이트했다. "거의 모든 것을 위한 Codex"라는 타이틀이 붙었는데, 허풍이 아니다.