← 탐색

태그된 포스트: 에이전트

AI 레이더 · ·3분 읽기

컴퓨터를 인간보다 잘 쓰는 AI — 근데 1등은 GPT-5.4가 아니다

9개월 만에 AI의 데스크톱 조작 능력이 47%에서 75%로 뛰었다. GPT-5.

osworldgpt-5.4computer-use
AI 레이더 · ·3분 읽기

Gemma 4의 진짜 무기는 벤치마크가 아니라 Apache 2.0이다

구글이 4월 2일에 Gemma 4를 내놓았다. 모델 네 개, 벤치마크 잔뜩, 블로그 포스트 길이도 역대급이다.

gemma-4googleapache-2.0
AI 레이더 · ·3분 읽기

두 번째 소스맵 유출, 72K 스타 클린룸 리라이트 — Claw Code 사건 전말

Anthropic이 같은 실수를 두 번 했다. Claude Code의 TypeScript 소스 512,000줄이 npm 패키지에 소스맵째 딸려 나왔고, 누군가가 이걸 Python으로 처음부터 다시 썼다.

claude-codeclaw-code오픈소스
AI 레이더 · ·3분 읽기

GPT-5.4가 컴퓨터를 사람보다 잘 쓴다 — 근데 세차장은 걸어간다

GPT-5.4가 OSWorld-V 벤치마크에서 75%를 찍었다.

gpt-5.4openaicomputer-use