← 탐색

태그된 포스트: 비용최적화

AI 실무 적용기 · ·3분 읽기

컨텍스트 100만 토큰 시대, RAG를 걷어내도 될까

"컨텍스트 윈도우가 100만 토큰인데 RAG 파이프라인을 왜 유지해야 하지?" 3월 초, 팀 내 백엔드 개발자가 던진 질문이었다.

rag롱컨텍스트프로덕션
AI 실무 적용기 · ·3분 읽기

전체 LLM 호출의 80%는 비싼 모델이 필요 없었다

프로덕션 LLM 서비스를 운영하면서 가장 먼저 깨달은 건, 비용 문제는 모델 성능이 아니라 호출 패턴에서 터진다는 점이었다. 모델을 바꾸거나 프롬프트를 쥐어짜기 전에, 요청 자체를 들여다봐야 한다.

llm비용최적화라우팅
클라우드 네이티브 · ·2분 읽기

HCP Terraform 무료 종료, 내일이다

어제 퇴근 전에 HashiCorp에서 메일 한 통 왔다. "Your legacy Free plan will be transitioned on March 31, 2026.

terraformhcp-terraformiac