1.3.3 AI音乐：谷歌AI模型MusicLM实现音乐即兴创作_从ChatGPT到AIGC：智能创作与应用赋能-QQ阅读男生都市网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

1.3.3　AI音乐：谷歌AI模型MusicLM实现音乐即兴创作

2023年1月27日，谷歌发布AI内容生成领域的新模型—MusicLM。这是继视频生成工具Imagen Video、文本生成模型Wordcraft之后，谷歌再次推出的内容生成式AI模型，该模型瞄准了音乐创作领域。

其实，普通用户想通过AI模型创作音乐并不是一件容易的事情。AI音乐是在很多信号的相互作用之下形成的，包括音色、音调、音律、音量等，这是一个充满复杂性的综合系统。因此，早期的一些AI自动生成工具所创作的音乐往往具备明显的合成痕迹，听起来很不自然。

此前，可视化AI工具Dance Diffusion、Riffusion能自主创作音乐，OpenAI也曾推出AI音乐生成工具Jukebox。但是这些AI音乐生成工具受限于数据和技术等因素，只能创作简单的音乐，而对于相对复杂的音乐，它们无法保障音乐的质量和高保真度。AI模型要实现真正意义上的音乐自动生成，需要通过大量数据模拟和训练，这是AI自动生成工具在保障音乐质量上必不可少的基础性步骤。

MusicLM能够在更加复杂的场景中直接将图像和文字进行合成，自动生成音乐，并且曲风多样。MusicLM生成的音乐不仅可以满足用户的多样化需求，而且能够最大限度地保障音乐的高保真度。

MusicLM还支持通过图像生成音乐，世界名作《星空》《格尔尼卡》《呐喊》等都可以作为生成音乐的内容素材，这是AI音乐生成领域的一大突破。MusicLM不仅能够帮助用户识别乐器，还能够融合各种音乐流派，通过用户提供的抽象概念生成音乐。例如，用户想为养成型游戏配置一段音乐，只需要输入文字“养成型游戏的主配乐，动感且轻快”，MusicLM便可以按照要求自动生成音乐。

MusicLM的训练数据很庞大，为理解深度、复杂的音乐场景提供坚实基础。MusicLM针对音乐生成任务具有缺乏评估数据等问题，专门引入了MusicCaps来为音乐生成任务提供更好的评估。