AI 에이전트 엔지니어링 | 마이클 알바다 | 한빛미디어 - 예스24
Paper

AI 에이전트 엔지니어링 | 마이클 알바다 | 한빛미디어 - 예스24

마이클 알바다 저/강민혁 역
2026.01.28
·Web·by 권준호
#AI Agent#Agent Engineering#LLM#RAG#Multi-agent Systems

핵심 포인트

  • 1이 책은 도구, 지식, 메모리를 결합한 AI 에이전트를 설계, 구축, 배포하는 올인원 가이드이다.
  • 2단일 에이전트부터 멀티 에이전트 시스템까지 AI 에이전트의 핵심 구성 요소, 오케스트레이션, 지식과 메모리, 그리고 학습 방법을 체계적으로 설명한다.
  • 3나아가 AI 에이전트 시스템의 검증, 모니터링, 보안, 거버넌스, 그리고 인간과의 협업까지 다루며 프로덕션 환경에서의 실전 운영 지침을 제시한다.

『AI 에이전트 엔지니어링』은 단일 에이전트부터 멀티 에이전트 시스템에 이르기까지 AI 애플리케이션 개발의 전 과정을 다루는 포괄적인 실전 가이드입니다. 이 책은 생성형 AI 시대에 기업들이 단순 자동화를 넘어 도구, 지식, 메모리를 결합한 AI 에이전트를 활용하여 더욱 복잡한 문제를 해결할 수 있도록 돕는 것을 목표로 합니다. 코딩, 리서치, 분석 에이전트 등 다양한 형태의 AI 에이전트를 설계, 조율, 배포하는 과정에서 직면하는 난제들을 명확한 설계 원칙과 실무 중심의 접근 방식으로 돌파할 수 있는 로드맵을 제시합니다.

이 책의 핵심 방법론은 AI 에이전트 시스템의 개념 정립부터 운영 및 거버넌스까지 전체 라이프사이클을 체계적으로 다루는 데 있습니다. 주요 내용은 다음과 같습니다.

PART 1: 에이전트 시스템의 개념과 UX (Concepts and UX of Agent Systems)

  • CHAPTER 1: 에이전트 (Agents): AI 에이전트의 정의와 foundation model이 가져온 혁명적 변화를 설명합니다. 에이전트 유형 분류, model selection, synchronous에서 asynchronous로의 전환, 다양한 활용 사례, 그리고 workflow 내에서 에이전트의 역할을 다룹니다. 효과적인 agentic system 구축 원칙과 조직 전략을 제시하며, LangChain과 같은 agentic framework의 중요성을 강조합니다.
  • CHAPTER 2: 에이전트 시스템 설계 (Agent System Design): AI 에이전트 시스템의 핵심 구성 요소인 tools, memory, orchestration에 대해 심층적으로 다룹니다. 특히 tools 섹션에서는 특정 작업을 해결하는 tool 설계, tool 통합과 모듈성(modularity)을 강조합니다. memory는 short-term memory와 long-term memory로 구분하고, memory management 및 retrieval 기법을 설명합니다. 설계 과정에서의 trade-off(성능, scalability, reliability, 비용)를 탐색하고, single-agent architecture와 multi-agent architecture(협업, 병렬성, 조율)와 같은 architecture design pattern을 제시합니다. 점진적 설계, 평가 전략, 실환경 테스트 등 모범 사례도 포함합니다.
  • CHAPTER 3: 에이전트 시스템을 위한 UX 디자인 (UX Design for Agent Systems): 에이전트 시스템의 UX 디자인에 초점을 맞춥니다. Text-based, graphic, voice, video 등 다양한 modalities를 결합하여 seamless한 사용자 경험을 제공하는 방법을 논의하고, 에이전트의 autonomy slider 개념을 소개합니다. synchronous 및 asynchronous 에이전트 경험을 위한 디자인 원칙, context 유지 및 연속성, 에이전트 능력 커뮤니케이션(신뢰도, 불확실성, 사용자 지침, 우아한 실패 처리), 상호작용 설계에서의 신뢰 구축 등을 다룹니다.

PART 2: 에이전트 시스템의 구축과 확장 (Building and Scaling Agent Systems)

  • CHAPTER 4: 도구 (Tools): LangChain을 기반으로 local tools, API-based tools, plugin tools, MCP(Multi-hop Contextual Prompting), stateful tools 등 다양한 tool 구현 방법을 설명합니다. foundation model을 활용한 tool 개발 자동화 및 실시간 code generation 기법을 다룹니다.
  • CHAPTER 5: 오케스트레이션 (Orchestration): 에이전트의 의사결정 및 행동 순서를 제어하는 orchestration에 중점을 둡니다. Reflexive Agent, ReAct Agent, Plan-and-execute Agent, Query Decomposition Agent, Reflective Agent, Deep Research Agent 등 다양한 agent types을 소개합니다. Standard tool selection, semantic tool selection, hierarchical tool selection 등 tool selection 전략과 tool execution, tool topology(single tool execution, parallel tool execution, chain, graph)를 설명하고, context engineering의 중요성을 강조합니다.
  • CHAPTER 6: 지식과 메모리 (Knowledge and Memory): memory의 기본 사용법(context window 관리, full-text search)부터 semantic memory와 vector store를 활용한 semantic search, RAG(Retrieval Augmented Generation), semantic experience memory, GraphRAG(지식 그래프 활용) 등 고급 memory 기법을 다룹니다.
  • CHAPTER 7: 에이전틱 시스템의 학습 (Learning in Agentic Systems): 에이전트 시스템의 학습 방식을 비모수적 학습(non-parametric learning, 예: In-context learning, Reflexion, 경험 학습)과 모수적 학습(parametric learning, 예: fine-tuning, SFT(Supervised Fine-Tuning), DPO(Direct Preference Optimization), RLVR(Reinforcement Learning from Verbose Rewards))으로 나누어 설명합니다.
  • CHAPTER 8: 단일 에이전트에서 멀티 에이전트로 (From Single Agent to Multi-Agent): 단일 에이전트 시나리오와 멀티 에이전트 시나리오의 필요성을 비교하고, 에이전트 추가 원칙, swarm 개념을 소개합니다. Multi-agent coordination 기법(Democratic, Manager-centric, Hierarchical, Actor-Critic)과 agentic system의 자동 설계 방법을 다룹니다. Local communication과 distributed communication, A2A(Agent-to-Agent) protocol, message broker와 event bus, Actor framework, orchestration 및 workflow engine, state 및 persistence 관리 등 멀티 에이전트 시스템 구축에 필요한 기술적 요소들을 상세히 설명합니다.

PART 3: 신뢰할 수 있는 에이전트 운영과 거버넌스 (Reliable Agent Operation and Governance)

  • CHAPTER 9: 검증 및 측정 (Validation and Measurement): 에이전트 시스템의 측정(measurement)이 핵심임을 강조하며, 개발 라이프사이클에 평가를 통합하고 평가 세트 생성 및 확장을 다룹니다. Tool, 계획 능력, memory, 학습 능력 등 component-level 평가와 end-to-end 시나리오에서의 성능, 일관성, 응집성, hallucination, 예기치 않은 입력 처리 등 holistic evaluation을 제시합니다.
  • CHAPTER 10: 운영 환경 모니터링 (Monitoring Operating Environments): 모니터링이 학습의 출발점임을 명시하고, Grafana, ELK Stack, Arize Phoenix, SigNoz, Langfuse 등 다양한 monitoring stack을 소개합니다. OpenTelemetry 계측, 시각화, 알림(alerting) 설정 방법을 다루며, shadow mode, canary deployment, regression trace collection, self-healing agent 등 monitoring pattern과 사용자 피드백, 분포 변화(distribution shift), 지표 소유권과 기능 간 거버넌스 등 운영의 중요 요소를 설명합니다.
  • CHAPTER 11: 개선 루프 (Improvement Loop): 피드백 파이프라인(자동화된 이슈 탐지, 근본 원인 분석, 인간 개입 리뷰, prompt 및 tool 정제, 개선 항목 집계 및 우선순위화)을 통해 시스템을 지속적으로 개선하는 방법을 제시합니다. Shadow deployment, A/B testing, Bayesian bandit 등 실험 기법과 In-context learning, offline retraining 등 지속 학습(continuous learning) 방안을 다룹니다.
  • CHAPTER 12: 에이전틱 시스템 보안 (Securing Agentic Systems): 에이전틱 시스템이 가진 고유한 위험과 새로운 공격 수단을 분석합니다. Foundation model 보안(방어 기법, red teaming, MAESTRO 기반 위협 모델링), 데이터 보호(데이터 privacy 및 암호화, 데이터 출처 및 무결성, 민감 데이터 처리), 에이전트 보안(보호 장치, 외부 위협 및 내부 실패로부터의 보호) 등 광범위한 보안 주제를 다룹니다.
  • CHAPTER 13: 인간과 에이전트의 협업 (Human-Agent Collaboration): 에이전트 시스템에서 인간의 역할과 자율성(autonomy) 조절, 이해관계자 정렬 및 도입 추진을 논합니다. 협업 확장(에이전트 범위와 조직 역할, 공유 memory 및 context 경계)을 다루고, 신뢰, 거버넌스, 컴플라이언스(신뢰의 lifecycle, 책임성 framework, 대응 절차 설계 및 감독, privacy 및 규제 컴플라이언스) 등 윤리적이고 책임감 있는 AI 에이전트 개발의 방향성을 제시하며 인간-에이전트 팀의 미래를 전망합니다.

저자인 마이클 알바다(Michael Albada)는 Microsoft, Uber, ServiceNow에서 대규모 machine learning 솔루션을 설계하고 배포한 경험을 바탕으로, 실제 프로덕션 수준의 AI 에이전트 시스템을 구축하고 운영하는 데 필요한 핵심 개념과 패턴, 모범 사례를 체계적으로 정리했습니다. 이 책은 만들어둔 prototype을 장애나 예외에도 흔들리지 않게 개선하여 production에 배포하고 싶은 machine learning/software engineer, multi-agent orchestration을 설계하고 싶은 backend/platform engineer, 기존 workflow에 에이전트를 통합하여 운영 체계를 갖추고 싶은 technical product manager/product owner 등 실무자에게 실용적인 안내서 역할을 합니다. 특히 특정 framework 사용법이나 단편적인 예제에 그치지 않고, AI 에이전트 시스템의 전체 흐름을 체계적으로 다루며 실무 사례를 풍부하게 제시하여 추상적인 개념을 구체화하는 데 큰 도움을 줍니다.