솔직히 말하면, 지금까지 음성 AI 에이전트를 프로덕션에 넣은 팀은 대부분 고통받았다. Whisper로 STT 하고, GPT로 처리하고, TTS로 돌려주는 3단 파이프라인.
3억 명이 쓰던 챗봇을 죽이는 데는 이유가 있다. Amazon이 어제 Rufus 챗봇 폐기를 공식 발표하고, 그 자리에 Alexa for Shopping이라는 에이전트를 올렸다.
음성 AI 에이전트를 만들어본 사람이라면 한 가지 좌절 포인트를 안다. 모델이 듣고 말은 할 수 있는데, 생각은 못 한다는 것.
15개월 전 Anthropic의 연간 반복 매출(ARR)은 10억 달러였다. 2026년 4월 기준 300억 달러.
Linear에 이슈 던져놓고 퇴근했더니 다음 날 PR이 올라와 있다. 그것도 하나가 아니라 여러 개.
AWS에서 AI 모델을 쓴다면 그동안 선택지가 명확했다. Bedrock에 Claude, SageMaker에 오픈소스 모델.
어제 OpenAI가 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체했다.
5월 4일, 두 건의 발표가 몇 시간 간격으로 쏟아졌다. OpenAI는 10B짜리 "The Deployment Company"를, Anthropic은 1.
OpenAI가 앱 없는 스마트폰을 만들고 있다는 소식이 나왔다. 홈 화면에 아이콘 격자 대신 AI 에이전트들이 실시간으로 일하는 "라이브 패널"이 깔린다고 한다.
4월 16일, OpenAI가 Codex를 대규모로 업데이트했다. "거의 모든 것을 위한 Codex"라는 타이틀이 붙었는데, 허풍이 아니다.
OpenAI가 처음으로 범용이 아닌 도메인 특화 모델을 출시했다. 이름은 GPT-Rosalind — DNA 구조 규명의 숨은 공로자 로절린드 프랭클린에서 따왔고, 타겟은 신약 개발과 유전체 연구다.
8일 사이에 똑같은 일이 두 번 일어났다. 프론티어 랩 두 곳이 공격력 있는 사이버 AI를 각자 꺼냈고, 정반대 선택을 했다.
OpenAI가 4월 6일에 터뜨린 뉴스를 한 문장으로 요약하면 이렇다 — ChatGPT, Codex, Atlas 브라우저를 하나의 데스크탑 앱으로 합쳤다. 이름은 거창하게 '슈퍼앱'.
OpenAI가 Whisper로 음성 인식 시장을 평정한 줄 알았다. 근데 그 Whisper를 꺾은 모델이 OpenAI 파트너인 Microsoft 내부에서 나왔다.
프론티어 모델 API를 쓰는 개발자라면 이번 달 들어 계정 인증이 조금 까다로워졌다는 걸 느꼈을 수 있다. 이유가 있다 — OpenAI, Anthropic, Google 세 회사가 사상 처음으로 증류 공격 탐지 정보를 공유하기 시작했다.
OpenAI가 Sora를 접었다. 3월 24일 조용히 올라온 공지 하나로 AI 영상 생성의 가장 화려한 실험이 막을 내렸다.
GPT-5.4가 OSWorld-V 벤치마크에서 75%를 찍었다.