← 탐색

태그된 포스트: kubernetes

백엔드 깊이보기 · ·3분 읽기

maximumPoolSize=10인데 DB 커넥션이 380개가 된 이유

새벽 4시 반, 슬랙에 "DB connection pool exhausted" 알림이 쏟아졌다. DB 서버의 CPU 사용률은 15%.

spring boothikaricpkubernetes
백엔드 깊이보기 · ·3분 읽기

Actuator health 엔드포인트가 파드 12개를 연쇄로 죽인 밤

readiness probe 설정할 때 "/actuator/health 쓰면 되죠?"라고 대답하는 개발자가 많다.

spring bootkubernetesactuator
클라우드 네이티브 · ·3분 읽기

Pod 리사이즈, 이제 재시작 안 해도 된다

운영 중인 서비스에서 Pod가 OOM으로 뻗기 직전이다. 메모리 limit을 올려야 하는데, 지금까지의 정석은 Deployment spec을 수정하고 롤링 업데이트를 기다리는 거였다.

kubernetesk8s-1.36in-place-resize
클라우드 네이티브 · ·3분 읽기

컨테이너 깨고 나와봐야 root가 아니다

프로덕션 클러스터에서 컨테이너 탈출 CVE가 올라오면 제일 먼저 확인하는 게 뭘까. 해당 Pod가 root로 돌고 있었는지다.

kubernetesk8s-1.36user-namespaces
데브옵스 리얼톡 · ·2분 읽기

renewBefore: 2h — 14,000개 서비스가 TLS를 잃은 설정 한 줄

2026년 3월 12일 오후 2시 17분(UTC). PagerDuty가 14,000건의 알림을 동시에 쏟아냈다.

cert-managerlets-encrypttls
클라우드 네이티브 · ·3분 읽기

Tekton이 CNCF로 넘어왔다 — Argo에 밀리던 판이 바뀔까

3월에 CNCF TOC가 Tekton을 인큐베이팅 프로젝트로 받아들였다. CD Foundation에서 7년을 보낸 녀석이 쿠버네티스 생태계의 본진으로 옮겨온 셈인데, 솔직히 주변 반응은 "아, 그거 아직 쓰는 데 있어?

tektoncncfci-cd
데브옵스 리얼톡 · ·3분 읽기

ArgoCD 3.0이 폴링을 죽였다

누군가 프로덕션에서 kubectl edit를 친다. 12분 뒤에야 Argo가 "어, 뭔가 바뀌었네?

argocdgitopskubernetes
클라우드 네이티브 · ·3분 읽기

ingress-nginx가 죽은 지 7주, 보안 패치는 이미 끊겼다

3월 24일, SIG Network과 Security Response Committee가 공식적으로 ingress-nginx 프로젝트를 은퇴시켰다. "은퇴"라는 표현이 부드럽게 들리지만, 실질적 의미는 간단하다 — 오늘 CVE가 터져도 패치 안 나온다.

ingress-nginxkubernetesgateway-api
데브옵스 리얼톡 · ·3분 읽기

Grafana가 K8s 모니터링 Helm 차트를 갈아엎은 이유

클러스터 80개를 돌리는 팀에서 모니터링 Helm 차트 values.yaml이 1,500줄을 넘어갔다는 제보를 본 적이 있다.

grafanakuberneteshelm
데브옵스 리얼톡 · ·3분 읽기

핫픽스 올려놨는데 GitOps가 3분간 나를 무시했다

새벽 2시, PagerDuty 알람에 잠이 깼다. 원인은 금방 찾았고 5분 만에 핫픽스를 커밋했다.

fluxgitopskubernetes
클라우드 네이티브 · ·2분 읽기

6년 묵은 구멍, 결국 필드째 날렸다

CVE-2020-8554가 처음 보고된 게 2020년 12월이다. 그로부터 5년 넘게, 쿠버네티스 프로젝트는 이 취약점에 "수정 불가" 딱지를 붙여놓고 admission webhook 하나 던져주는 게 전부였다.

kubernetesk8s-1.36externalips
데브옵스 리얼톡 · ·2분 읽기

minReplicas: 0으로 비용 아꼈더니 새벽에 서비스가 증발했다

새벽 3시 15분에 PagerDuty가 울렸다. API 응답률 0%.

kuberneteshpaautoscaling
클라우드 네이티브 · ·3분 읽기

containerd 1.7, 3월에 죽었다 — 9월 연장전 끝나기 전에 할 일

3월 10일 자로 containerd 1.7의 공식 지원이 종료됐다.

containerdkubernetescontainer-runtime
클라우드 네이티브 · ·2분 읽기

Docker에 OPA 걸어놓고 안심했다면 — CVE-2026-34040 이야기

운영 환경에 Docker AuthZ 플러그인 걸어놓고 "우리는 됐지"라고 생각했던 팀이 있을 거다. OPA든 Prisma Cloud든, API 요청마다 정책 검사가 돌아가니까 안심이 되긴 한다.

dockerauthzcve-2026-34040
백엔드 깊이보기 · ·2분 읽기

Graceful Shutdown 설정했는데 502가 계속 나오는 이유

배포할 때마다 502가 몇 건씩 찍힌다. Grafana 봐도 서버 과부하가 아니고, Rolling Update가 돌 때만 나타난다.

spring bootkubernetesgraceful shutdown
클라우드 네이티브 · ·2분 읽기

주말 사이에 세 곳이 뚫렸다 — 내 CI 파이프라인은 괜찮은가

금요일 밤 npm에서 시작된 게 일요일 아침엔 Docker Hub까지 번져 있었다. 48시간 동안 세 패키지 레지스트리에서 악성 패키지가 동시에 터졌고, 셋 다 노린 건 같은 거였다 — 크레덴셜.

supply-chain보안npm
클라우드 네이티브 · ·3분 읽기

1.36 나왔다 — 새 기능보다 '드디어 졸업' 모음이 핵심

오늘(4월 22일) Kubernetes 1.36이 정식 릴리스됐다.

kubernetesk8s-1.36hpa
데브옵스 리얼톡 · ·3분 읽기

리소스 리퀘스트 반으로 깎았더니 클러스터가 지뢰밭이 됐다

FinOps 대시보드에 찍힌 숫자 하나가 모든 걸 바꿨다. "쿠버네티스 리소스 활용률 평균 18%.

finopskubernetes리소스최적화
클라우드 네이티브 · ·3분 읽기

GPU 절반이 놀고 있다 — 비용부터 잡자

올해 클라우드 비용 리뷰 미팅에서 GPU 항목 보고 한숨 안 쉰 팀이 있나. AI 워크로드가 프로덕션에 올라가면서 GPU 인스턴스 비용이 전체 클라우드 지출의 40~60%를 차지하는 팀이 늘고 있다.

kubernetesgpufinops
백엔드 깊이보기 · ·3분 읽기

Pod 시작 12초를 1초로 줄인 건 GraalVM이 아니었다

작년 겨울, 트래픽 피크 때마다 HPA가 Pod를 늘리는데 Spring Boot 앱이 뜨는 데 12초가 걸렸다. 12초면 이미 늦다.

javaproject leydenspring boot
1 / 2 Next →