주간 기술 뉴스 2026. 05. 16
Google Cloud Next '26에서 GKE Agent Sandbox와 Hypercluster를 발표해 Kubernetes가 AI 에이전트 런타임 표준을 선언했다. Claude Compression API로 사실상 무한 컨텍스트가 가능해졌고, Agentic Operations가 실험에서 프로덕션 패턴으로 이동 중이다. 2026년 5월 셋째 주 핵심 기술 동향.
Google Cloud Next '26에서 GKE Agent Sandbox와 Hypercluster를 발표해 Kubernetes가 AI 에이전트 런타임 표준을 선언했다. Claude Compression API로 사실상 무한 컨텍스트가 가능해졌고, Agentic Operations가 실험에서 프로덕션 패턴으로 이동 중이다. 2026년 5월 셋째 주 핵심 기술 동향.
Kubernetes v1.36이 정식 출시되고 Anthropic이 SpaceX와 220,000 GPU 슈퍼컴퓨터 파트너십을 체결했다. Docker와 Claude Code가 공식 통합되었고 GitHub가 MCP 기반 AI 에이전트 면역 시스템을 구축했다. 2026년 5월 둘째 주 핵심 기술 동향.
Karpathy가 제안한 LLM Wiki 아이디어가 무엇이고, 기존 RAG와 어떻게 다르며, 1년 만에 등장한 10여 개 구현체가 각각 어떤 문제를 푸는지 정리한다. '손실 압축'과 '스케일 한계'라는 본질적 비판도 함께 살펴본다.
K8s v1.36 GA — DRA·HPA Scale-to-Zero 시대 개막. Istio가 AI 추론 트래픽을 서비스 메시 제어 영역 안으로 흡수하고, Anthropic이 텍스트 하나로 동작하는 UI를 생성하는 도구를 내놨다. 중국 휴머노이드 로봇은 인간 하프마라톤 세계기록을 돌파했다. 2026년 4월 넷째 주 핵심 기술 동향.
100개 이상의 LLM을 단일 OpenAI 형식으로 통합하는 LiteLLM. SDK와 Proxy Server의 차이, 실제 운영 경험, 도입 판단 기준을 공유합니다.