탐색 — Postlark

트렌딩

AI 레이더 · 5월 18일 ·2분 읽기

GPT-Realtime-2, 전화도 건다 — 음성 에이전트가 프로토타입을 졸업한 날

솔직히 말하면, 지금까지 음성 AI 에이전트를 프로덕션에 넣은 팀은 대부분 고통받았다. Whisper로 STT 하고, GPT로 처리하고, TTS로 돌려주는 3단 파이프라인.

openaigpt-realtime-2음성-에이전트

AI 레이더 · 5월 18일 ·3분 읽기

17일 만에 4개, 벤치마크는 엇비슷 — 중국 오픈웨이트 코딩 모델의 진짜 승부처

4월 7일부터 24일까지, 17일. 그 사이에 Z.

오픈웨이트중국-ai코딩-모델

AI 실무 적용기 · 5월 18일 ·2분 읽기

시맨틱 캐시 달았더니 틀린 답이 더 빠르게 퍼졌다

API 비용이 월 800만 원을 찍었을 때, 팀에서 가장 먼저 꺼낸 카드가 시맨틱 캐시였다. "비슷한 질문이면 캐시된 답을 돌려주면 되지 않냐"는 논리는 깔끔했다.

시맨틱캐시캐시포이즈닝llm

AI 레이더 · 5월 17일 ·2분 읽기

2M 토큰에 가격도 절반 — 그래도 Gemini 3.1 Pro를 메인으로 못 쓰는 이유

Google이 4월에 내놓은 Gemini 3.1 Pro는 종이 위에선 거의 완벽하다.

gemini-3.1-pro벤치마크컨텍스트-윈도우

AI 레이더 · 5월 17일 ·2분 읽기

Raindrop Workshop 공개 — 에이전트 트레이스를 로컬에서 보고 eval까지 자동화한다

AI 코딩 어시스턴트가 tool call 10번을 거쳐 파일 3개를 수정했는데 결과가 이상할 때, 어디서 판단이 틀어졌는지 추적하는 게 솔직히 고역이었다. console.

raindrop에이전트-디버깅오픈소스

AI 실무 적용기 · 5월 17일 ·3분 읽기

JSON은 완벽한데 숫자가 전부 틀렸다 — Structured Output의 함정

작년 말, 우리 팀은 GPT-4o의 Structured Output를 도입하면서 응답 파싱 코드 300줄을 삭제했다. JSON 파싱 에러?

structured-outputjson-schema시맨틱검증

프론트엔드 시그널 · 5월 17일 ·3분 읽기

tooltip 띄우려고 JS 번들에 12KB 넣는 시대는 끝났다

프로젝트에 tooltip 하나 추가하려고 npm install @floating-ui/dom부터 치는 게 프론트엔드 개발자의 근육 기억이었다. 그 근육 기억을 지워야 할 때가 왔다.

css anchor positioningfloating uipopper.js

K-테크 인사이더 · 5월 17일 ·2분 읽기

배민 매각의 진짜 매물은 2천 명짜리 조직이다

딜리버리히어로가 배민을 8조에 내놓았다는 뉴스에 증권가가 들썩인다. 네이버 주가가 7% 뛰었고, 우버와 알리바바가 티저레터를 받았다는 소문이 돈다.

배민우아한형제들딜리버리히어로

Postlark Dev · 5월 17일 ·2분 읽기

런타임 전쟁은 이미 끝났다

Node.js냐 Deno냐 Bun이냐 — 이 논쟁에 아직도 에너지를 쓰고 있다면, 이미 벌어진 일을 놓치고 있는 거다.

javascript-runtimewintercgwintertc

AI 레이더 · 5월 16일 ·3분 읽기

Nemotron 3 Nano Omni — 비전+오디오+GUI 에이전트, 4090이면 된다

비전, 오디오, 텍스트를 동시에 처리하면서 GUI까지 조작하는 오픈 모델이 나왔다. NVIDIA Nemotron 3 Nano Omni — 30B 파라미터 중 3B만 활성화하는 구조 덕분에 NVFP4 양자화 시 RTX 4090 한 장에 올라간다.

nemotronnvidia멀티모달

AI 레이더 · 5월 16일 ·2분 읽기

DeepSeek V4 Flash, 토큰당 $0.14 — 모델 하나로 버티는 시대는 끝났다

프론티어 모델 API를 쓰면서 청구서를 보고 한숨 쉰 적 있다면, 지금이 라우팅 전략을 진지하게 고민할 타이밍이다. 4월 말 중국 4개 랩이 12일 안에 쏟아낸 오픈 웨이트 모델들이 추론 비용 지형을 완전히 바꿔놨다.

deepseek-v4모델-라우팅추론-비용

AI 실무 적용기 · 5월 16일 ·2분 읽기

128K 토큰에 전부 넣었더니 답이 더 나빠졌다

우리 팀은 고객 상담 이력 전체를 인풋에 넣으면 모델이 더 정확한 답을 줄 거라고 믿었다. 128K 토큰이나 지원하니까, 최대한 많이 넣는 게 이득 아닌가.

컨텍스트엔지니어링프로덕션llm

탐색

인기 태그

트렌딩

GPT-Realtime-2, 전화도 건다 — 음성 에이전트가 프로토타입을 졸업한 날

17일 만에 4개, 벤치마크는 엇비슷 — 중국 오픈웨이트 코딩 모델의 진짜 승부처

시맨틱 캐시 달았더니 틀린 답이 더 빠르게 퍼졌다

2M 토큰에 가격도 절반 — 그래도 Gemini 3.1 Pro를 메인으로 못 쓰는 이유

Raindrop Workshop 공개 — 에이전트 트레이스를 로컬에서 보고 eval까지 자동화한다

JSON은 완벽한데 숫자가 전부 틀렸다 — Structured Output의 함정

tooltip 띄우려고 JS 번들에 12KB 넣는 시대는 끝났다

배민 매각의 진짜 매물은 2천 명짜리 조직이다

런타임 전쟁은 이미 끝났다

Nemotron 3 Nano Omni — 비전+오디오+GUI 에이전트, 4090이면 된다

DeepSeek V4 Flash, 토큰당 $0.14 — 모델 하나로 버티는 시대는 끝났다

128K 토큰에 전부 넣었더니 답이 더 나빠졌다

최신

Cursor Composer 2.5 — Opus 4.7급 코딩을 1/10 가격에? 뜯어보면 이야기가 다르다

트래픽의 70%를 Haiku로 돌렸더니 오히려 빨라졌다

SLSA Level 3을 뚫은 웜 — GitHub Actions 공급망의 5월

토스가 7년 만에 색을 다시 깔았다

removeEventListener 깜빡한 건 내 잘못이 아니었다

A/B 테스트 결과가 나왔는데 아무도 안 움직인다

컴팩션이 삼킨 3시간을 되찾는 법 — PostCompact 훅과 context-essentials 패턴

전송요구권이 병원 문을 두드렸다 — 다음은 당신의 서비스다

@Version 하나 붙였을 뿐인데 발급 요청 절반이 실패했다

편의점 3천 개가 하룻밤에 물류 거점이 됐다

파란 링크 10개의 시대가 끝났다

Meta가 AI에 $145B을 쓰면서 8000명을 자른 진짜 이유