1.3.3 AI音乐:谷歌AI模型MusicLM实现音乐即兴创作
2023年1月27日,谷歌发布AI内容生成领域的新模型—MusicLM。这是继视频生成工具Imagen Video、文本生成模型Wordcraft之后,谷歌再次推出的内容生成式AI模型,该模型瞄准了音乐创作领域。
其实,普通用户想通过AI模型创作音乐并不是一件容易的事情。AI音乐是在很多信号的相互作用之下形成的,包括音色、音调、音律、音量等,这是一个充满复杂性的综合系统。因此,早期的一些AI自动生成工具所创作的音乐往往具备明显的合成痕迹,听起来很不自然。
此前,可视化AI工具Dance Diffusion、Riffusion能自主创作音乐,OpenAI也曾推出AI音乐生成工具Jukebox。但是这些AI音乐生成工具受限于数据和技术等因素,只能创作简单的音乐,而对于相对复杂的音乐,它们无法保障音乐的质量和高保真度。AI模型要实现真正意义上的音乐自动生成,需要通过大量数据模拟和训练,这是AI自动生成工具在保障音乐质量上必不可少的基础性步骤。
MusicLM能够在更加复杂的场景中直接将图像和文字进行合成,自动生成音乐,并且曲风多样。MusicLM生成的音乐不仅可以满足用户的多样化需求,而且能够最大限度地保障音乐的高保真度。
MusicLM还支持通过图像生成音乐,世界名作《星空》《格尔尼卡》《呐喊》等都可以作为生成音乐的内容素材,这是AI音乐生成领域的一大突破。MusicLM不仅能够帮助用户识别乐器,还能够融合各种音乐流派,通过用户提供的抽象概念生成音乐。例如,用户想为养成型游戏配置一段音乐,只需要输入文字“养成型游戏的主配乐,动感且轻快”,MusicLM便可以按照要求自动生成音乐。
MusicLM的训练数据很庞大,为理解深度、复杂的音乐场景提供坚实基础。MusicLM针对音乐生成任务具有缺乏评估数据等问题,专门引入了MusicCaps来为音乐生成任务提供更好的评估。