Introducing Perplexity Computer
핵심 포인트
- 1Perplexity Computer는 다양한 최신 AI 모델의 역량을 통합하여 복잡한 워크플로우를 생성하고 실행하는 범용 디지털 작업 시스템입니다.
- 2이 시스템은 주어진 목표를 세부 작업으로 나누고, Opus 4.6을 핵심 추론 엔진으로 사용하여 Gemini, Nano Banana 등 각 작업에 최적화된 전문화된 모델들을 지능적으로 오케스트레이션하여 작업을 수행합니다.
- 3Perplexity Computer는 실제 파일 시스템과 브라우저에 접근 가능한 격리된 환경에서 작동하며, Perplexity Max 구독자에게 제공되어 AI의 협업 능력을 극대화합니다.
Perplexity Computer는 첨단 AI 모델들이 더욱 지능화됨에 따라 기존 제품 인터페이스가 이들의 잠재력을 온전히 발휘하는 데 병목 현상으로 작용하고, 각 모델의 전문화가 심화되면서 다양한 AI 역량을 통합하는 데 어려움이 있다는 문제의식에서 출발합니다. 이에 Perplexity Computer는 현존하는 모든 최상위 AI 역량을 단일 시스템으로 통합하여 AI의 활용을 극대화하는 것을 목표로 합니다.
이 시스템은 "general-purpose digital worker"로서, 인간 협력자와 동일한 인터페이스로 소프트웨어 스택을 운영합니다. 기존의 채팅 인터페이스가 답변을 제공하고 에이전트가 단일 작업을 수행하는 수준을 넘어, Perplexity Computer는 완전한 워크플로우를 생성하고 실행하며, 이는 몇 시간에서 심지어 몇 달 동안 지속될 수 있습니다.
핵심 방법론 (Core Methodology)은 사용자가 원하는 "outcome"(결과)을 명시하는 것으로 시작됩니다. Perplexity Computer는 이 "outcome"을 달성하기 위해 복잡한 작업을 "tasks"와 "subtasks"로 세분화합니다. 이 과정에서 각 세분화된 작업의 실행을 위해 동적으로 "sub-agents"를 생성하고 배포합니다. 이 "sub-agents"들은 웹 리서치, 문서 생성, 데이터 처리, 또는 연결된 서비스에 대한 API 호출과 같은 다양한 기능을 수행할 수 있습니다. 예를 들어, 하나의 "sub-agent"가 문서를 초안 작성하는 동안 다른 "sub-agent"는 필요한 데이터를 수집하는 등, 작업 간의 조정은 자동으로 이루어지며 비동기적으로 진행됩니다.
Perplexity Computer의 내부 작동은 "reasoning", "delegating", "searching", "building", "remembering", "coding", "delivering"이라는 핵심 역량을 기반으로 합니다. 특히 문제가 발생했을 때, 시스템은 그 문제를 해결하기 위한 새로운 "sub-agents"를 생성합니다. 이는 API 키를 찾거나, 추가 정보를 리서치하거나, 필요하다면 애플리케이션을 코딩하는 등 자율적인 문제 해결 능력을 포함합니다. 시스템이 스스로 해결할 수 없는 경우에만 사용자에게 개입을 요청합니다.
각 "task"는 "isolated compute environment"에서 실행되며, 이 환경은 "real filesystem", "real browser", 그리고 "real tool integrations"에 대한 접근 권한을 가집니다. 이는 강력한 AI 모델을 안전하고 통제된 환경에서 운용할 수 있게 하며, 특정 로컬 설정 없이 보편적으로 접근 가능하게 만듭니다.
Perplexity Computer의 가장 중요한 아키텍처적 특징은 "intelligent multi-model orchestration"입니다. 논문은 AI 모델들이 "commoditizing"되는 것이 아니라, 오히려 각 모델이 특정 유형의 작업에 "specializing"되고 있다고 주장합니다. 따라서 가장 강력한 AI 시스템은 단일 모델이나 모델군에 의존하는 것이 아니라, 여러 전문화된 모델들을 지능적으로 조율하고 활용하는 시스템이라는 철학을 따릅니다. 현재(논문 작성 시점) Perplexity Computer는 Opus 4.6을 핵심 "reasoning engine"으로 사용하며, 특정 작업에 최적화된 "sub-agents"를 다음과 같은 모델들로 오케스트레이션합니다:
- Gemini: "deep research" 및 "sub-agent" 생성
- Nano Banana: 이미지 관련 작업
- Veo 3.1: 비디오 관련 작업
- Grok: "lightweight tasks"에서의 속도
- ChatGPT 5.2: "long-context recall" 및 광범위한 검색
Perplexity의 "model agnostic harness"는 이러한 모델 구성이 AI 기술 발전에 따라 유연하게 변경될 수 있도록 합니다. 또한, 사용자는 "token budget" 등 다양한 고려사항에 맞춰 특정 "subtask"에 사용할 모델을 직접 선택할 수 있는 "choice and control"을 제공받습니다.
결론적으로, Perplexity Computer는 복잡한 작업을 자율적으로 분할하고, 여러 전문화된 AI 모델들을 지능적으로 오케스트레이션하며, 실제 컴퓨팅 환경에서 실행되는 "digital worker"로서 AI 활용의 새로운 패러다임을 제시합니다.