태그된 포스트: claude-code

컨텍스트 윈도우를 200k로 줄였더니 결과가 좋아졌다

Anthropic의 컨텍스트 윈도우는 지금 200k를 넘어 최대 1M 토큰까지 지원합니다. 그런데 최근 한 개발자가 환경변수 하나로 컨텍스트 윈도우를 200k로 강제 제한했더니 오히려 Claude Code의 출력 품질이 올라갔다는 실험 결과를 공개했습니다.

claude-codecontext-engineeringcompaction

클로드코드 딥다이브 · 7월 7일 ·5분 읽기

프롬프트를 그만 쓰고 루프를 설계하라 — Claude Code 창시자가 말하는 다음 단계

Claude Code를 만든 Boris Cherny가 6월에 한 말이 개발자 커뮤니티를 관통했습니다. "나는 더 이상 Claude에게 프롬프트를 쓰지 않는다.

claude-codeloop-engineeringharness-engineering

클로드코드 딥다이브 · 7월 5일 ·5분 읽기

서브에이전트 에러가 '성공'으로 기록되던 시절은 끝났다

2주 전까지만 해도 서브에이전트가 rate limit에 걸려 텍스트를 한 줄도 생성하지 못한 채 종료되면, 부모 에이전트는 빈 문자열을 "정상적인 결과"로 받아들였습니다.

claude-codesubagenterror-handling

클로드코드 딥다이브 · 7월 3일 ·6분 읽기

도구는 열어두고 파라미터만 잠근다 — Tool(param:value) 매칭으로 서브에이전트 권한을 정밀 제어하기

서브에이전트가 Opus 모델을 요청할 때마다 토큰 비용이 치솟는 상황, Bash 도구 자체는 필요하지만 백그라운드 실행만 막고 싶은 상황 — 이런 "도구는 허용하되 특정 사용 방식만 제한하고 싶다"는 요구는 하네스 엔지니어링에서 오래된 난제였습니다.

claude-codeharness-engineeringpermissions

클로드코드 딥다이브 · 6월 7일 ·6분 읽기

계획을 코드에 두면 품질의 천장이 달라진다 — Dynamic Workflows 실전 해부

보안 감사를 서브에이전트 다섯 개에 나눠 돌렸는데, 결과를 합쳐보니 같은 취약점을 서로 다른 이름으로 보고한 것이 세 건, 실제로는 취약점이 아닌 오탐이 두 건이었습니다. 에이전트를 더 많이 돌린다고 품질이 올라가지는 않습니다.

claude-codedynamic-workflowssubagent

클로드코드 딥다이브 · 6월 3일 ·6분 읽기

컨텍스트 로트 — 세션이 길어질수록 Claude Code 결과가 나빠지는 구조적 원인과 대응

Claude Code로 복잡한 리팩토링을 하다 보면 이상한 시점이 찾아옵니다. 처음 30분은 CLAUDE.

claude-codecontext-rotcontext-engineering

클로드코드 딥다이브 · 6월 1일 ·6분 읽기

만든 에이전트가 채점하면 성공률 10점을 잃는다 — Outcomes 루브릭 패턴을 Claude Code에 옮기기

같은 세션에서 코드를 짜고 "방금 만든 코드 리뷰해줘"라고 요청하면, 돌아오는 답은 대부분 관대합니다. 자기가 작성한 추론 과정이 컨텍스트에 그대로 남아 있으니, 모델은 그 논리를 따라가며 "합리적이다"라고 판단하게 됩니다.

claude-codeoutcomesrubric

AI 레이더 · 5월 29일 ·3분 읽기

코드 10만 줄 마이그레이션, 프롬프트 한 줄로 끝내는 시대

Anthropic이 5월 28일 Opus 4.8을 출시하면서 같이 내놓은 게 하나 있다.

anthropicopus-4-8dynamic-workflows

클로드코드 딥다이브 · 5월 29일 ·6분 읽기

스킬에 도구 제한을 거는 disallowed-tools — 허용 목록의 정반대가 필요했던 이유

코드 리뷰 스킬을 하나 만들었는데, 리뷰하라고 시킨 에이전트가 파일을 직접 수정하기 시작한 적이 있습니다. allowed-tools로 Read, Grep, Glob만 허용하면 해결되겠지만, 새로운 도구가 추가될 때마다 허용 목록을 수동으로 갱신해야 했습니다.

claude-codeskillsdisallowed-tools

AI 레이더 · 5월 27일 ·2분 읽기

80배 성장이 인프라를 부쉈다 — Anthropic 9000억 달러 뒤의 진짜 이야기

Anthropic가 이번 주 9000억 달러를 넘는 기업가치로 펀딩 라운드를 마감하면서 OpenAI의 8520억 달러를 제치고 세계에서 가장 비싼 AI 스타트업이 됐다.

anthropicclaude-code밸류에이션

클로드코드 딥다이브 · 5월 27일 ·4분 읽기

관측할 수 없는 에이전트는 품질도 없다 — Agent View와 worktree 격리 실전 가이드

Claude Code를 쓰는 팀이라면 한 번쯤 이런 시도를 합니다. 터미널 5개를 열고, 각각 다른 작업을 claude --bg로 던진 뒤 커피를 마시러 갑니다.

claude-codeagent-viewworktree

클로드코드 딥다이브 · 5월 25일 ·5분 읽기

REVIEW.md 한 장이 리뷰 에이전트 4개의 판단 기준을 바꾼다

CLAUDE.md의 존재감은 이미 충분히 증명됐습니다.

claude-codecode-reviewreview.md

클로드코드 딥다이브 · 5월 23일 ·5분 읽기

같은 git status인데 토큰 편차가 1,098배 — PostToolUse 출력 교체로 컨텍스트 입구를 조율한다

세션 중반, 컨텍스트가 넉넉할 때는 아무도 도구 출력의 크기를 신경 쓰지 않습니다. git status 결과가 5줄이든 200줄이든 작업은 잘 돌아갑니다.

claude-codehooksposttooluse

클로드코드 딥다이브 · 5월 21일 ·5분 읽기

컴팩션이 삼킨 3시간을 되찾는 법 — PostCompact 훅과 context-essentials 패턴

3시간 동안 디버깅 세션을 이어가며 겨우 재현 조건을 잡아낸 순간, 컨텍스트가 95%를 넘기면서 자동 컴팩션이 발동합니다.

claude-codehookspostcompact

클로드코드 딥다이브 · 5월 19일 ·4분 읽기

MCP 도구 50개가 매 턴 먹는 2만 토큰 — 플러그인 컨텍스트 비용을 읽는 법

/context를 한 번이라도 실행해본 개발자라면, MCP 도구가 예상보다 많은 컨텍스트를 점유하고 있다는 사실에 놀랐을 겁니다. 한 사용자의 실측 기록을 보면 MCP 도구 스키마만으로 200K 컨텍스트 윈도우의 41% — 82,000 토큰 — 가 소진되었습니다.

claude-codeplugincontext-engineering

AI 레이더 · 5월 17일 ·2분 읽기

Raindrop Workshop 공개 — 에이전트 트레이스를 로컬에서 보고 eval까지 자동화한다

AI 코딩 어시스턴트가 tool call 10번을 거쳐 파일 3개를 수정했는데 결과가 이상할 때, 어디서 판단이 틀어졌는지 추적하는 게 솔직히 고역이었다. console.

raindrop에이전트-디버깅오픈소스

클로드코드 딥다이브 · 5월 17일 ·5분 읽기

세션의 96%를 차지하는 보이지 않는 무게 — 도구 결과 클리어링의 원리와 실전 전략

Claude Code로 긴 세션을 돌려본 경험이 있다면, 한 가지 패턴을 느꼈을 겁니다. 초반에는 명쾌하게 파일을 읽고 수정하던 에이전트가, 세션이 20턴을 넘어가면서 점점 같은 파일을 다시 읽거나 이전에 확인한 내용을 잊어버리는 현상.

claude-codecontext-engineeringclear-tool-uses

AI 레이더 · 5월 15일 ·3분 읽기

Grok Build 베타 — 플랜 모드는 진짜 좋고, 월 $300은 진짜 비싸다

xAI가 코딩 에이전트 시장에 정식으로 도전장을 던졌다. 5월 14일 얼리 베타로 출시된 Grok Build는 2M 토큰 컨텍스트와 병렬 서브에이전트를 앞세운 터미널 네이티브 CLI다.

grok-buildxai코딩-에이전트

클로드코드 딥다이브 · 5월 15일 ·5분 읽기

지시문 200줄을 전부 무시하는 구조적 원인 — CLAUDE.md 과잉 문제와 계층 분리 설계

Anthropic의 공식 권장은 간결합니다. "Ruthlessly prune — Claude가 이미 올바르게 하는 것이면 삭제하거나 훅으로 바꾸세요.

claude-codeclaude.mdharness-engineering

클로드코드 딥다이브 · 5월 13일 ·5분 읽기

작업과 평가를 다른 모델에 맡기는 이유 — /goal 커맨드 해부

Claude Code에서 모듈 마이그레이션을 시작하면 흔히 겪는 리듬이 있습니다. Opus가 코드를 고치고, 테스트를 돌리고, 실패를 발견하고, 다시 고치고 — 이 사이클을 개발자가 매 턴 "계속해"를 입력하며 감독합니다.

claude-codegoal-commanddual-model-evaluation

1 / 3 Next →