태그된 포스트: 에이전트

AI 레이더 · 5월 16일 ·3분 읽기

Nemotron 3 Nano Omni — 비전+오디오+GUI 에이전트, 4090이면 된다

비전, 오디오, 텍스트를 동시에 처리하면서 GUI까지 조작하는 오픈 모델이 나왔다. NVIDIA Nemotron 3 Nano Omni — 30B 파라미터 중 3B만 활성화하는 구조 덕분에 NVFP4 양자화 시 RTX 4090 한 장에 올라간다.

nemotronnvidia멀티모달

AI 실무 적용기 · 5월 13일 ·2분 읽기

MCP 붙이면 끝이라더니 — 프로덕션에선 세션이 먼저 죽었다

우아한형제들이 교육 운영 시스템에 RAG를 붙이려고 할 때, 처음 손이 간 건 MCP였다. 표준 프로토콜로 LLM과 데이터 소스를 연결하면 깔끔하겠다는 판단.

mcp프로토콜에이전트

AI 실무 적용기 · 5월 11일 ·2분 읽기

Function Calling 실패는 에러 로그에 안 남는다

지난달 고객사 챗봇의 "주문 조회" 기능이 이상하다는 CS 리포트가 올라왔다. 로그를 뒤져봤다.

function-callingtool-use프로덕션

디자인 시스템 로그 · 5월 7일 ·3분 읽기

MCP가 드러낸 디자인 시스템의 빈틈

Figma MCP 서버를 연결하고 Claude Code에서 "이 화면 구현해줘"를 던졌을 때, 첫 번째로 깨달은 건 에이전트의 능력이 아니라 우리 Figma 파일의 민낯이었다.

mcpfigma디자인시스템

AI 실무 적용기 · 5월 4일 ·3분 읽기

에이전트 7개 도입했는데 서로 말도 안 통한다

올해 초 한 이커머스 회사에서 들은 이야기가 계속 머릿속에 남아 있다.

에이전트사일로프로덕션

AI 레이더 · 4월 29일 ·3분 읽기

GPT-5.5, 두 배 비싸진 만큼 두 배 나아졌을까

GPT-5.4가 나온 지 두 달도 안 됐는데 5.

gpt-5.5openai벤치마크

AI 실무 적용기 · 4월 29일 ·3분 읽기

모델 세 번 바꿨는데 성공률은 하네스가 올렸다

올해 1분기에 고객 문의 자동 분류 에이전트를 프로덕션에 올렸다. 내부 테스트에서 92%를 찍던 성공률이 실제 트래픽을 받으니 47%로 곤두박질.

에이전트하네스프로덕션

AI 실무 적용기 · 4월 28일 ·3분 읽기

에이전트 메모리 10만 건 넘기고 나서야 '망각'을 설계했다

고객 문의에 "작년 9월에 말씀하셨던 것처럼..."이라고 시작하는 에이전트를 보고 감탄했다.

에이전트메모리프로덕션

AI 레이더 · 4월 27일 ·2분 읽기

에이전트 10개 중 9개가 프로덕션에서 죽는 이유

기업이 에이전트 하나에 15만80만 달러(2억11억 원)를 쓰고, 10곳 중 9곳이 프로덕션 배포 전에 접는다. 스탠포드 HAI가 이번 달 내놓은 AI Index 2026 보고서에 담긴 숫자다.

에이전트스탠포드ai-index-2026

AI 레이더 · 4월 25일 ·3분 읽기

멀티턴 대화에서 LLM 성능 39% 하락 — 20만 건이 증명한 에이전트의 아킬레스건

Claude Code한테 코드 리팩터링을 시키다가 다섯 번째 턴쯤 되면 갑자기 엉뚱한 파일을 건드리기 시작한 경험, 다들 있을 거다. 착각이 아니었다.

iclr-2026멀티턴llm-성능

AI 레이더 · 4월 23일 ·2분 읽기

구글 신규 코드의 75%, AI가 쓰고 엔지니어가 도장 찍는다

순다르 피차이가 Cloud Next 키노트에서 던진 숫자 하나가 개발자 커뮤니티를 뒤흔들고 있다. "오늘 구글의 신규 코드 75%는 AI가 생성하고, 엔지니어가 승인합니다.

구글cloud-next-2026ai-코딩

AI 실무 적용기 · 4월 19일 ·2분 읽기

MCP 데모는 주말이면 끝났다 — 프로덕션은 3개월 걸렸다

MCP 서버 하나 띄우는 건 진짜 쉽다. 공식 SDK 설치하고 도구 몇 개 정의하면 금요일 저녁에 시작해서 일요일 낮이면 Claude Desktop에서 동작하는 데모가 나온다.

mcp프로덕션에이전트

AI 레이더 · 4월 13일 ·2분 읽기

주니어 고용 -20%, 생산성 +26% — AI Index가 포착한 비대칭

스탠포드 HAI가 매년 내놓는 AI Index 보고서가 어제 나왔다. 348페이지에서 숫자 하나가 유독 눈에 밟힌다 — 22~25세 소프트웨어 개발자 고용이 2024년 이후 약 20% 줄었다.

스탠포드ai-index개발자-고용

AI 실무 적용기 · 4월 13일 ·2분 읽기

RAG에 에이전트를 얹었더니 정확도는 올랐는데 비용이 7배 뛰었다

지난 달 우리 팀은 기존 RAG 파이프라인에 에이전트 루프를 추가했다. 검색 결과를 보고 "이걸로 충분한가?

agentic-rag에이전트rag

AI 레이더 · 4월 10일 ·3분 읽기

Sonnet 비용에 Opus 두뇌를 빌리는 Anthropic Advisor Strategy

코딩 에이전트를 돌려본 개발자라면 한 번쯤 이런 고민을 했을 거다. Opus급으로 돌리면 결과는 좋은데 청구서가 아프고, Sonnet으로 내리면 지갑은 편한데 복잡한 리팩터링에서 삐끗한다.

anthropicadvisor-toolclaude-opus

AI 실무 적용기 · 4월 9일 ·3분 읽기

에이전트에 메모리 달았더니 느려지고 틀려졌다

에이전트가 이전 대화를 기억하게 만들면 사용자 경험이 확 좋아질 거라고 생각했다. 반은 맞고 반은 완전히 틀렸다.

에이전트메모리프로덕션

AI 레이더 · 4월 6일 ·3분 읽기

코파일럿 정체, Claude Code 6배 — JetBrains 1만 명 서베이가 포착한 대전환

JetBrains가 이번 주 1만 명 규모 서베이 결과를 공개했다. 2026년 1월 기준으로 개발자 90%가 업무에 AI 도구를 쓰고 있고, 74%는 범용 챗봇이 아닌 전문 코딩 도구를 쓴다.

jetbrains서베이claude-code

AI 레이더 · 4월 4일 ·3분 읽기

컴퓨터를 인간보다 잘 쓰는 AI — 근데 1등은 GPT-5.4가 아니다

9개월 만에 AI의 데스크톱 조작 능력이 47%에서 75%로 뛰었다. GPT-5.

osworldgpt-5.4computer-use

AI 레이더 · 4월 3일 ·3분 읽기

Gemma 4의 진짜 무기는 벤치마크가 아니라 Apache 2.0이다

구글이 4월 2일에 Gemma 4를 내놓았다. 모델 네 개, 벤치마크 잔뜩, 블로그 포스트 길이도 역대급이다.

gemma-4googleapache-2.0

AI 레이더 · 4월 2일 ·3분 읽기

두 번째 소스맵 유출, 72K 스타 클린룸 리라이트 — Claw Code 사건 전말

Anthropic이 같은 실수를 두 번 했다. Claude Code의 TypeScript 소스 512,000줄이 npm 패키지에 소스맵째 딸려 나왔고, 누군가가 이걸 Python으로 처음부터 다시 썼다.

claude-codeclaw-code오픈소스

1 / 2 Next →