Expanding Vertex AI with Claude Opus 4.6. | Google Cloud Blog
핵심 포인트
- 1Google Cloud는 2026년 2월 5일 Vertex AI에서 Anthropic의 최신이자 가장 강력한 모델인 Claude Opus 4.6을 정식 출시했으며, 이는 복잡한 코딩, 정교한 에이전트, 그리고 엔터프라이즈 워크플로우에 탁월한 성능을 제공합니다.
- 2Vertex AI는 Claude Opus 4.6 사용자를 위해 Agent Builder, Agent Engine, Memory Bank 등 포괄적인 AI 스택을 제공하여 생산성을 높이고, 글로벌 규모의 확장성과 거버넌스를 지원합니다.
- 3이 플랫폼은 최적화된 인프라를 통해 성능을 향상시키고 비용을 절감하며, Model Armor와 같은 고급 보안 기능을 통합하여 AI 시스템의 안정성과 신뢰성을 보장합니다.
Google Cloud는 2026년 2월 5일에 Vertex AI에 Anthropic의 최신 모델인 Claude Opus 4.6을 추가한다고 발표했습니다. Claude Opus 4.6은 Anthropic의 가장 강력한 모델로, 복잡한 코딩 작업 및 정교한 에이전트 생성에 탁월하며, 엔터프라이즈 워크플로우(문서, 스프레드시트, 프레젠테이션 생성)에서도 전문적인 완성도와 도메인 인식을 통해 큰 발전을 제공합니다.
주요 사용 사례로는 정밀도가 중요한 금융, 법률 분야의 엔터프라이즈 워크플로우 지원, 규제 서류, 시장 보고서, 내부 데이터를 통합하는 금융 분석, 요구사항 수집부터 구현 및 유지보수까지 전체 라이프사이클을 포함하는 코딩 작업 가속화 (수일에서 수시간으로 단축), 신뢰성 향상 및 오류 복구 기능을 갖춘 복잡한 다단계 워크플로우 오케스트레이션(Agentic tasks), 복잡한 시각적 해석 및 다단계 탐색을 필요로 하는 컴퓨터 사용 워크플로우 활성화 등이 있습니다.
Vertex AI를 통해 Claude Opus 4.6을 사용하고자 하는 기업들은 Google Cloud Marketplace를 통해 신속하게 모델을 배포하고 조달 및 결제 과정을 간소화할 수 있습니다. Claude Opus 4.6 on Vertex AI의 Feature availability는 Adaptive Thinking, Fine-grained tool streaming toggle, Effort parameter, 128k Output Tokens, Tool params quoting consistency가 GA(General Availability) 상태이며, Compaction API와 1M Context Window는 Preview 상태입니다.
Vertex AI는 Frontier models에 대한 접근성과 세계적인 수준의 AI 개발 플랫폼을 동시에 제공하여, 복잡한 에이전트를 구축하기 위한 완전한 Agentic stack을 제공합니다. 이는 프로덕션, 거버넌스 및 글로벌 규모의 복잡성을 관리하도록 설계되었습니다. 핵심 방법론은 다음과 같습니다:
- 에이전트 시스템 구축 및 확장:
- 신속한 지능형 에이전트 구축: Vertex AI Agent Builder stack과 Agent Development Kit(ADK)를 활용하여 다단계 Agentic workflows를 프로토타입 단계에서 확장된 프로덕션으로 전환할 수 있습니다.
- 완전 관리형 서비스로 에이전트 확장: Agent Engine을 사용하여 서버리스 환경에서 에이전트를 배포하고 확장하며, Memory Bank 및 Sessions를 통해 Claude 기반 에이전트가 여러 상호작용에 걸쳐 영구적인 장기 컨텍스트를 유지하여 자연스러운 사용자 경험을 제공합니다.
- 성능 최적화 및 비용 절감:
- 성능 및 비용 효율성 향상: Provisioned Throughput을 통해 고정 비용으로 피크 수요 시에도 일관된 성능을 유지하며, Claude를 위한 Global endpoint, 유연한 TTL(Time To Live)을 가진 Prompt caching, Batch predictions, Web search (preview), Claude Opus 4.6을 위한 1M context window (preview)와 같은 기능을 활용하여 효율성을 높일 수 있습니다.
- 최적화된 인프라에서 실행: Vertex AI의 인프라는 Frontier models의 컴퓨팅 요구사항을 처리하도록 특별히 구축되어 지연 시간을 줄이고 효율성을 향상시킵니다.
- 대규모 거버넌스 및 보안:
- 보안 및 거버넌스: 통합된 거버넌스 제어가 에이전트의 작업을 추적하고 로그를 남기며, Google Cloud의 기본적인 보안 및 데이터 레지던시(data residency) 제어 기능을 통해 모델 및 에이전트를 포함한 전체 AI stack을 보호합니다. 또한, Model Armor를 통해 Prompt injection 및 Tool poisoning과 같은 새로운 AI 위협으로부터 보호하며, Security Command Center의 Advanced AI Protection을 통해 AI 위험을 우선순위화하고 위협을 탐지합니다.
이러한 포괄적인 기능들을 통해 Vertex AI는 Claude 모델과 결합하여 기업들이 AI 기반 애플리케이션 및 에이전트를 구축하고 확장하는 데 필요한 강력하고 안전하며 효율적인 플랫폼을 제공합니다. Shopify, spring.new, TELUS, Augment Code, Palo Alto Networks, Replit과 같은 여러 기업들이 Claude on Vertex AI의 이점을 강조하며, 특히 코딩, Tool calling, 개발 속도 향상, 보안 강화 등에서 긍정적인 성과를 보고했습니다.