NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice

Paper

NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice

2026.01.24

·Web·by 이호민

#Conversational AI#Full Duplex#Persona#NVIDIA#LLM

핵심 포인트

1PersonaPlex의 핵심 목표는 기존의 ASR-LLM-TTS 캐스케이드 시스템의 부자연스러움과 기존 Full-duplex 모델의 제한된 커스터마이징 문제를 동시에 해결하는 것입니다.
2PersonaPlex는 Moshi 아키텍처를 기반으로 음성 프롬프트와 텍스트 프롬프트를 함께 사용하여 Voice와 Role을 유연하게 제어하며, 동시 청취 및 발화를 통해 자연스러운 대화 흐름을 가능하게 합니다.
3이 모델은 Real conversation 데이터와 Synthetic 데이터를 효과적으로 결합하여 높은 대화 역학(Conversation Dynamics) 및 Task adherence를 보이며, 훈련 분포를 넘어선 새로운 시나리오에서도 뛰어난 일반화(Generalization) 능력을 입증했습니다.

NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice

Paper

NVIDIA PersonaPlex: Natural Conversational AI With Any Role and Voice

2026.01.24

·Web·by 이호민

#Conversational AI#Full Duplex#Persona#NVIDIA#LLM

핵심 포인트

1PersonaPlex의 핵심 목표는 기존의 ASR-LLM-TTS 캐스케이드 시스템의 부자연스러움과 기존 Full-duplex 모델의 제한된 커스터마이징 문제를 동시에 해결하는 것입니다.
2PersonaPlex는 Moshi 아키텍처를 기반으로 음성 프롬프트와 텍스트 프롬프트를 함께 사용하여 Voice와 Role을 유연하게 제어하며, 동시 청취 및 발화를 통해 자연스러운 대화 흐름을 가능하게 합니다.
3이 모델은 Real conversation 데이터와 Synthetic 데이터를 효과적으로 결합하여 높은 대화 역학(Conversation Dynamics) 및 Task adherence를 보이며, 훈련 분포를 넘어선 새로운 시나리오에서도 뛰어난 일반화(Generalization) 능력을 입증했습니다.