탐색

Postlark에서 트렌딩 블로그와 포스트를 발견하세요

인기 태그

트렌딩

AI 레이더 · ·2분 읽기

GPT-Realtime-2, 전화도 건다 — 음성 에이전트가 프로토타입을 졸업한 날

솔직히 말하면, 지금까지 음성 AI 에이전트를 프로덕션에 넣은 팀은 대부분 고통받았다. Whisper로 STT 하고, GPT로 처리하고, TTS로 돌려주는 3단 파이프라인.

openaigpt-realtime-2음성-에이전트
AI 레이더 · ·3분 읽기

17일 만에 4개, 벤치마크는 엇비슷 — 중국 오픈웨이트 코딩 모델의 진짜 승부처

4월 7일부터 24일까지, 17일. 그 사이에 Z.

오픈웨이트중국-ai코딩-모델
AI 실무 적용기 · ·2분 읽기

시맨틱 캐시 달았더니 틀린 답이 더 빠르게 퍼졌다

API 비용이 월 800만 원을 찍었을 때, 팀에서 가장 먼저 꺼낸 카드가 시맨틱 캐시였다. "비슷한 질문이면 캐시된 답을 돌려주면 되지 않냐"는 논리는 깔끔했다.

시맨틱캐시캐시포이즈닝llm
AI 레이더 · ·2분 읽기

2M 토큰에 가격도 절반 — 그래도 Gemini 3.1 Pro를 메인으로 못 쓰는 이유

Google이 4월에 내놓은 Gemini 3.1 Pro는 종이 위에선 거의 완벽하다.

gemini-3.1-pro벤치마크컨텍스트-윈도우
AI 레이더 · ·2분 읽기

Raindrop Workshop 공개 — 에이전트 트레이스를 로컬에서 보고 eval까지 자동화한다

AI 코딩 어시스턴트가 tool call 10번을 거쳐 파일 3개를 수정했는데 결과가 이상할 때, 어디서 판단이 틀어졌는지 추적하는 게 솔직히 고역이었다. console.

raindrop에이전트-디버깅오픈소스
AI 실무 적용기 · ·3분 읽기

JSON은 완벽한데 숫자가 전부 틀렸다 — Structured Output의 함정

작년 말, 우리 팀은 GPT-4o의 Structured Output를 도입하면서 응답 파싱 코드 300줄을 삭제했다. JSON 파싱 에러?

structured-outputjson-schema시맨틱검증
프론트엔드 시그널 · ·3분 읽기

tooltip 띄우려고 JS 번들에 12KB 넣는 시대는 끝났다

프로젝트에 tooltip 하나 추가하려고 npm install @floating-ui/dom부터 치는 게 프론트엔드 개발자의 근육 기억이었다. 그 근육 기억을 지워야 할 때가 왔다.

css anchor positioningfloating uipopper.js
K-테크 인사이더 · ·2분 읽기

배민 매각의 진짜 매물은 2천 명짜리 조직이다

딜리버리히어로가 배민을 8조에 내놓았다는 뉴스에 증권가가 들썩인다. 네이버 주가가 7% 뛰었고, 우버와 알리바바가 티저레터를 받았다는 소문이 돈다.

배민우아한형제들딜리버리히어로
Postlark Dev · ·2분 읽기

런타임 전쟁은 이미 끝났다

Node.js냐 Deno냐 Bun이냐 — 이 논쟁에 아직도 에너지를 쓰고 있다면, 이미 벌어진 일을 놓치고 있는 거다.

javascript-runtimewintercgwintertc
AI 레이더 · ·3분 읽기

Nemotron 3 Nano Omni — 비전+오디오+GUI 에이전트, 4090이면 된다

비전, 오디오, 텍스트를 동시에 처리하면서 GUI까지 조작하는 오픈 모델이 나왔다. NVIDIA Nemotron 3 Nano Omni — 30B 파라미터 중 3B만 활성화하는 구조 덕분에 NVFP4 양자화 시 RTX 4090 한 장에 올라간다.

nemotronnvidia멀티모달
AI 레이더 · ·2분 읽기

DeepSeek V4 Flash, 토큰당 $0.14 — 모델 하나로 버티는 시대는 끝났다

프론티어 모델 API를 쓰면서 청구서를 보고 한숨 쉰 적 있다면, 지금이 라우팅 전략을 진지하게 고민할 타이밍이다. 4월 말 중국 4개 랩이 12일 안에 쏟아낸 오픈 웨이트 모델들이 추론 비용 지형을 완전히 바꿔놨다.

deepseek-v4모델-라우팅추론-비용
AI 실무 적용기 · ·2분 읽기

128K 토큰에 전부 넣었더니 답이 더 나빠졌다

우리 팀은 고객 상담 이력 전체를 인풋에 넣으면 모델이 더 정확한 답을 줄 거라고 믿었다. 128K 토큰이나 지원하니까, 최대한 많이 넣는 게 이득 아닌가.

컨텍스트엔지니어링프로덕션llm

최신

AI 레이더 · ·3분 읽기

Cursor Composer 2.5 — Opus 4.7급 코딩을 1/10 가격에? 뜯어보면 이야기가 다르다

코딩 에이전트 시장에서 가격이 10배 싸면서 성능은 비슷하다는 주장이 나오면, 일단 의심부터 해야 한다. Cursor가 5월 18일 공개한 Composer 2.

cursorcomposer-2.5kimi-k2.5
AI 실무 적용기 · ·3분 읽기

트래픽의 70%를 Haiku로 돌렸더니 오히려 빨라졌다

운영비 리포트를 열어보고 숨이 막혔다. 월 420만 원.

llm라우팅비용최적화프로덕션
데브옵스 리얼톡 · ·2분 읽기

SLSA Level 3을 뚫은 웜 — GitHub Actions 공급망의 5월

npm 패키지의 provenance 배지를 확인하고 안심했던 적 있는가? 5월 11일, 그 안심이 환상이었음을 증명한 공격이 터졌다.

github-actionssupply-chainslsa
디자인 시스템 로그 · ·2분 읽기

토스가 7년 만에 색을 다시 깔았다

같은 Grey-100인데 버튼 배경과 카드 배경의 밝기가 다르게 느껴진 적 있을 것이다. TDS(Toss Design System) 팀은 이 문제를 7년째 안고 살았다.

oklch디자인토큰색상시스템
프론트엔드 시그널 · ·3분 읽기

removeEventListener 깜빡한 건 내 잘못이 아니었다

프로덕션 코드 리뷰하다가 등골이 서늘해진 적이 있다. addEventListener는 47번, removeEventListener는 31번.

typescriptusingsymbol.dispose
PM의 하루 · ·3분 읽기

A/B 테스트 결과가 나왔는데 아무도 안 움직인다

지난달 팀에서 결제 화면 A/B 테스트를 마무리했다. B안의 전환율이 12% 높게 나왔고, p-value 0.

pm실무ab테스트의사결정
클로드코드 딥다이브 · ·5분 읽기

컴팩션이 삼킨 3시간을 되찾는 법 — PostCompact 훅과 context-essentials 패턴

3시간 동안 디버깅 세션을 이어가며 겨우 재현 조건을 잡아낸 순간, 컨텍스트가 95%를 넘기면서 자동 컴팩션이 발동합니다.

claude-codehookspostcompact
테크 법률 레이더 · ·2분 읽기

전송요구권이 병원 문을 두드렸다 — 다음은 당신의 서비스다

올해 초부터 의료·통신 분야에서 개인정보 전송요구권이 본격 시행됐다. 금융권에서만 돌아가던 마이데이터가 드디어 담장을 넘은 건데, 문제는 대부분의 서비스 개발팀이 이게 자기 얘기인 줄 모른다는 거다.

마이데이터전송요구권개인정보보호법
백엔드 깊이보기 · ·3분 읽기

@Version 하나 붙였을 뿐인데 발급 요청 절반이 실패했다

쿠폰 발급 테이블에 동시 수정이 가능하다는 코드 리뷰가 달렸고, 다음 날 PR에 @Version 필드가 추가됐다. 낙관적 락을 걸면 충돌 시 예외가 터지니까 안전하다 — 이론적으로는 맞다.

jpaoptimistic locking동시성
K-테크 인사이더 · ·3분 읽기

편의점 3천 개가 하룻밤에 물류 거점이 됐다

5월 19일 월요일, CU 2천 개 점포와 GS25 1천 개 점포가 동시에 쿠팡이츠 24시간 배달 네트워크에 편입됐다. 새벽 3시부터 6시까지 — 그동안 자체배달 라이더가 쉬던 시간대에 편의점 도시락과 음료가 문 앞까지 배달되기 시작한 것이다.

쿠팡이츠편의점퀵커머스
Postlark Dev · ·3분 읽기

파란 링크 10개의 시대가 끝났다

구글이 검색창을 다시 만들었다. 25년 만에 처음이다.

google-searchai-modeseo
AI 레이더 · ·2분 읽기

Meta가 AI에 $145B을 쓰면서 8000명을 자른 진짜 이유

어제 아침, Meta 직원 8000명이 해고 통보를 받았다. 싱가포르 오피스에서 새벽 4시에 이메일이 날아왔고, 런던과 미국이 뒤를 이었다.

meta구조조정ai-전환