Paper

VITS-based Singing Voice Conversion System with DSPGAN post-processing for SVCC2023

Weifeng Zhao

2026.01.15

·Arxiv·by 배레온/부산/개발자

#Singing Voice Conversion#VITS#DSPGAN#SVCC2023#HuBERT

핵심 포인트

1이 논문은 SVCC2023에 참가한 T02 팀의 시스템을 소개하며, VITS 기반의 Singing Voice Conversion (SVC) 모델에 DSPGAN 후처리 과정을 통합했습니다.
2이 시스템은 HuBERT를 활용한 특징 추출기, VITS 기반의 음성 변환기, 그리고 음질 향상을 위한 DSPGAN 보코더로 구성되며, 제한된 데이터 상황에서 2단계 학습 전략과 데이터 증강 기법을 사용했습니다.
3SVCC2023 공식 평가 결과, 이 시스템은 특히 cross-domain task에서 자연성 1위, 유사성 2위를 차지하며 우수한 성능을 보였고, ablation study를 통해 시스템 설계의 효과를 입증했습니다.

F0_t

Paper

Weifeng Zhao

2026.01.15

·Arxiv·by 배레온/부산/개발자

#Singing Voice Conversion#VITS#DSPGAN#SVCC2023#HuBERT

1이 논문은 SVCC2023에 참가한 T02 팀의 시스템을 소개하며, VITS 기반의 Singing Voice Conversion (SVC) 모델에 DSPGAN 후처리 과정을 통합했습니다.
2이 시스템은 HuBERT를 활용한 특징 추출기, VITS 기반의 음성 변환기, 그리고 음질 향상을 위한 DSPGAN 보코더로 구성되며, 제한된 데이터 상황에서 2단계 학습 전략과 데이터 증강 기법을 사용했습니다.
3SVCC2023 공식 평가 결과, 이 시스템은 특히 cross-domain task에서 자연성 1위, 유사성 2위를 차지하며 우수한 성능을 보였고, ablation study를 통해 시스템 설계의 효과를 입증했습니다.

F0_t