Postlark에서 트렌딩 블로그와 포스트를 발견하세요
솔직히 말하면, 지금까지 음성 AI 에이전트를 프로덕션에 넣은 팀은 대부분 고통받았다. Whisper로 STT 하고, GPT로 처리하고, TTS로 돌려주는 3단 파이프라인.
API 비용이 월 800만 원을 찍었을 때, 팀에서 가장 먼저 꺼낸 카드가 시맨틱 캐시였다. "비슷한 질문이면 캐시된 답을 돌려주면 되지 않냐"는 논리는 깔끔했다.
Google이 4월에 내놓은 Gemini 3.1 Pro는 종이 위에선 거의 완벽하다.
AI 코딩 어시스턴트가 tool call 10번을 거쳐 파일 3개를 수정했는데 결과가 이상할 때, 어디서 판단이 틀어졌는지 추적하는 게 솔직히 고역이었다. console.
작년 말, 우리 팀은 GPT-4o의 Structured Output를 도입하면서 응답 파싱 코드 300줄을 삭제했다. JSON 파싱 에러?
프로젝트에 tooltip 하나 추가하려고 npm install @floating-ui/dom부터 치는 게 프론트엔드 개발자의 근육 기억이었다. 그 근육 기억을 지워야 할 때가 왔다.
딜리버리히어로가 배민을 8조에 내놓았다는 뉴스에 증권가가 들썩인다. 네이버 주가가 7% 뛰었고, 우버와 알리바바가 티저레터를 받았다는 소문이 돈다.
Node.js냐 Deno냐 Bun이냐 — 이 논쟁에 아직도 에너지를 쓰고 있다면, 이미 벌어진 일을 놓치고 있는 거다.
비전, 오디오, 텍스트를 동시에 처리하면서 GUI까지 조작하는 오픈 모델이 나왔다. NVIDIA Nemotron 3 Nano Omni — 30B 파라미터 중 3B만 활성화하는 구조 덕분에 NVFP4 양자화 시 RTX 4090 한 장에 올라간다.
프론티어 모델 API를 쓰면서 청구서를 보고 한숨 쉰 적 있다면, 지금이 라우팅 전략을 진지하게 고민할 타이밍이다. 4월 말 중국 4개 랩이 12일 안에 쏟아낸 오픈 웨이트 모델들이 추론 비용 지형을 완전히 바꿔놨다.
우리 팀은 고객 상담 이력 전체를 인풋에 넣으면 모델이 더 정확한 답을 줄 거라고 믿었다. 128K 토큰이나 지원하니까, 최대한 많이 넣는 게 이득 아닌가.
코딩 에이전트 시장에서 가격이 10배 싸면서 성능은 비슷하다는 주장이 나오면, 일단 의심부터 해야 한다. Cursor가 5월 18일 공개한 Composer 2.
npm 패키지의 provenance 배지를 확인하고 안심했던 적 있는가? 5월 11일, 그 안심이 환상이었음을 증명한 공격이 터졌다.
같은 Grey-100인데 버튼 배경과 카드 배경의 밝기가 다르게 느껴진 적 있을 것이다. TDS(Toss Design System) 팀은 이 문제를 7년째 안고 살았다.
프로덕션 코드 리뷰하다가 등골이 서늘해진 적이 있다. addEventListener는 47번, removeEventListener는 31번.
지난달 팀에서 결제 화면 A/B 테스트를 마무리했다. B안의 전환율이 12% 높게 나왔고, p-value 0.
3시간 동안 디버깅 세션을 이어가며 겨우 재현 조건을 잡아낸 순간, 컨텍스트가 95%를 넘기면서 자동 컴팩션이 발동합니다.
올해 초부터 의료·통신 분야에서 개인정보 전송요구권이 본격 시행됐다. 금융권에서만 돌아가던 마이데이터가 드디어 담장을 넘은 건데, 문제는 대부분의 서비스 개발팀이 이게 자기 얘기인 줄 모른다는 거다.
쿠폰 발급 테이블에 동시 수정이 가능하다는 코드 리뷰가 달렸고, 다음 날 PR에 @Version 필드가 추가됐다. 낙관적 락을 걸면 충돌 시 예외가 터지니까 안전하다 — 이론적으로는 맞다.
5월 19일 월요일, CU 2천 개 점포와 GS25 1천 개 점포가 동시에 쿠팡이츠 24시간 배달 네트워크에 편입됐다. 새벽 3시부터 6시까지 — 그동안 자체배달 라이더가 쉬던 시간대에 편의점 도시락과 음료가 문 앞까지 배달되기 시작한 것이다.
어제 아침, Meta 직원 8000명이 해고 통보를 받았다. 싱가포르 오피스에서 새벽 4시에 이메일이 날아왔고, 런던과 미국이 뒤를 이었다.