Lyria 3
핵심 포인트
- 1Lyria 3은 프롬프트 기반의 최첨단 음악 생성 모델로, 고음질의 트랙을 만들고 자연스러운 음악적 흐름을 제공합니다.
- 2이 모델은 이미지를 음악으로 변환하거나, 사실적인 보컬 스타일 및 음향 선호도 등을 상세하게 설정하여 원하는 사운드를 구현할 수 있습니다.
- 3Lyria는 전문가 수준의 오디오를 Export할 수 있으며, Lyria 모델군은 클립, 트랙 또는 지속적인 스트림 형태의 음악을 생성할 수 있습니다.
Lyria 3는 Gemini에서 사용 가능한 최첨단 음악 생성 모델로, 사용자가 음악을 생성, 탐색 및 실험할 수 있도록 돕는 솔루션입니다. 이 모델은 "prompt"를 사용하여 음표 간의 자연스러운 흐름을 가진 고음질(high-fidelity) 트랙을 생성하는 데 중점을 둡니다.
핵심 방법론은 사용자 프롬프트 기반의 음악 생성에 있습니다. 모델은 텍스트 프롬프트를 입력받아 이를 고품질의 오디오로 변환하는 생성형 AI(generative AI) 기술을 활용합니다. 특히, 다음과 같은 기능을 통해 사용자에게 다양한 상호작용 및 제어 방식을 제공합니다.
- 이미지 기반 작곡 (Compose with images): 사용자가 이미지를 업로드하면 Lyria 3는 이를 기반으로 고음질의 맞춤형 트랙을 생성합니다. 이는 멀티모달(multimodal) 입력 처리 능력을 시사하며, 시각적 정보가 음악적 파라미터를 제어하거나 영감을 제공하는 방식으로 활용됨을 나타냅니다.
- 세부 지시 및 기술적 제어 (Direct the details): 사용자는 사실적인 보컬 스타일(vocal styles)이나 음향적 선호도(acoustic preferences) 등 음악의 세부 사항을 자유롭게 정의하고 기술적으로 제어할 수 있습니다. 이는 모델이 단순히 무작위 생성을 넘어, 사용자의 구체적인 의도를 반영하여 특정 사운드를 찾아낼 수 있는 정교한 제어 메커니즘을 내장하고 있음을 의미합니다.
- 전문가 수준 오디오 내보내기 (Export professional-grade audio): 생성된 트랙은 "crisp, clear tracks"로 묘사되며, 배경 앰비언스(background ambience)부터 메인스테이지 앤썸(mainstage anthem)까지 다양한 용도에 즉시 사용 가능한 "professional-grade audio"로 내보낼 수 있습니다. 이는 모델이 생성하는 오디오의 품질이 상업적 또는 전문적인 프로젝트에 적합할 만큼 매우 높음을 강조합니다.
Lyria는 단일 모델이 아닌 "model family"로, 다양한 길이(클립, 트랙) 또는 지속적인 스트림(constant stream) 형태의 음악 생성이 가능하도록 세분화되거나 확장될 수 있습니다. Lyria 3는 이러한 Lyria 모델 군의 최신 버전으로, 새로운 장르 탐색, 사운드스케이프(soundscapes) 실험, 음악적 영감 발견 등을 지원하며, Gemini를 통해 사용자에게 제공됩니다.