GPT-5.4가 OSWorld-V 벤치마크에서 75%를 찍었다.
내 맥북에 6.6GB짜리 모델 하나 깔았는데, 파라미터 수 13배 많은 OpenAI 모델보다 벤치마크 점수가 높다.
GPT-5.4가 코딩 벤치마크를 갈아엎고, Claude Opus 4.