비전, 오디오, 텍스트를 동시에 처리하면서 GUI까지 조작하는 오픈 모델이 나왔다. NVIDIA Nemotron 3 Nano Omni — 30B 파라미터 중 3B만 활성화하는 구조 덕분에 NVFP4 양자화 시 RTX 4090 한 장에 올라간다.
우아한형제들이 교육 운영 시스템에 RAG를 붙이려고 할 때, 처음 손이 간 건 MCP였다. 표준 프로토콜로 LLM과 데이터 소스를 연결하면 깔끔하겠다는 판단.
지난달 고객사 챗봇의 "주문 조회" 기능이 이상하다는 CS 리포트가 올라왔다. 로그를 뒤져봤다.
Figma MCP 서버를 연결하고 Claude Code에서 "이 화면 구현해줘"를 던졌을 때, 첫 번째로 깨달은 건 에이전트의 능력이 아니라 우리 Figma 파일의 민낯이었다.
올해 1분기에 고객 문의 자동 분류 에이전트를 프로덕션에 올렸다. 내부 테스트에서 92%를 찍던 성공률이 실제 트래픽을 받으니 47%로 곤두박질.
고객 문의에 "작년 9월에 말씀하셨던 것처럼..."이라고 시작하는 에이전트를 보고 감탄했다.
기업이 에이전트 하나에 15만80만 달러(2억11억 원)를 쓰고, 10곳 중 9곳이 프로덕션 배포 전에 접는다. 스탠포드 HAI가 이번 달 내놓은 AI Index 2026 보고서에 담긴 숫자다.
Claude Code한테 코드 리팩터링을 시키다가 다섯 번째 턴쯤 되면 갑자기 엉뚱한 파일을 건드리기 시작한 경험, 다들 있을 거다. 착각이 아니었다.
순다르 피차이가 Cloud Next 키노트에서 던진 숫자 하나가 개발자 커뮤니티를 뒤흔들고 있다. "오늘 구글의 신규 코드 75%는 AI가 생성하고, 엔지니어가 승인합니다.
MCP 서버 하나 띄우는 건 진짜 쉽다. 공식 SDK 설치하고 도구 몇 개 정의하면 금요일 저녁에 시작해서 일요일 낮이면 Claude Desktop에서 동작하는 데모가 나온다.
스탠포드 HAI가 매년 내놓는 AI Index 보고서가 어제 나왔다. 348페이지에서 숫자 하나가 유독 눈에 밟힌다 — 22~25세 소프트웨어 개발자 고용이 2024년 이후 약 20% 줄었다.
지난 달 우리 팀은 기존 RAG 파이프라인에 에이전트 루프를 추가했다. 검색 결과를 보고 "이걸로 충분한가?
코딩 에이전트를 돌려본 개발자라면 한 번쯤 이런 고민을 했을 거다. Opus급으로 돌리면 결과는 좋은데 청구서가 아프고, Sonnet으로 내리면 지갑은 편한데 복잡한 리팩터링에서 삐끗한다.
에이전트가 이전 대화를 기억하게 만들면 사용자 경험이 확 좋아질 거라고 생각했다. 반은 맞고 반은 완전히 틀렸다.
JetBrains가 이번 주 1만 명 규모 서베이 결과를 공개했다. 2026년 1월 기준으로 개발자 90%가 업무에 AI 도구를 쓰고 있고, 74%는 범용 챗봇이 아닌 전문 코딩 도구를 쓴다.
9개월 만에 AI의 데스크톱 조작 능력이 47%에서 75%로 뛰었다. GPT-5.
구글이 4월 2일에 Gemma 4를 내놓았다. 모델 네 개, 벤치마크 잔뜩, 블로그 포스트 길이도 역대급이다.
Anthropic이 같은 실수를 두 번 했다. Claude Code의 TypeScript 소스 512,000줄이 npm 패키지에 소스맵째 딸려 나왔고, 누군가가 이걸 Python으로 처음부터 다시 썼다.