美国网红兼流行歌手 Taryn Southern 近日发表了一张名为 I AM AI 的新专辑,成为人类历史上第一支正式发行的AI歌曲。
主打单曲《Break Free》虽然达不到格莱美的标准,但是完全听不出是由应用程序编曲,和音乐人的作品没有太大差别,颠覆了普通人认为AI制作出来的歌曲会比较机械、情感空白的认识。
实际上人工智能巨头公司都在深入研究AI音乐,一些AI音乐作品已经达到“大师级”,甚至到了“以假乱真”的地步。去年2月,第一部由算法创作的音乐剧《Beyond the Fence》在伦敦上演,获得较高评价;6月,Google研发的机器学习项目Magenta通过神经学习网络创作出了一首时长90秒的钢琴曲;9月,索尼计算机科学实验室人工智能程序创作一首披头士音乐风格的歌曲《Daddy's Car》,广受好评;百度公司人工智能(AI)可以在分析画作之后,作出与之风格相对应的曲子。
人工智能在作曲领域取得了许多令人欣喜的成就,已经成为能与人类协同创作复杂艺术作品的得力助手。那么,AI实现作曲的原理和技术路径、有哪些优缺点和需要解决的问题,本文智能相对论(+V号:aixdlun)简要通俗地讲讲。
AI作曲也在遵循“基本法”
音乐发展至今,所有的创新和突破都在竭尽所能地逼近人类极限,历代西方作曲大师无不在伟大作品中留下探索音乐与新技术融合之道的时代印记。
从基础理论设计与数学逻辑同构并进行符号化组织的角度来看,音乐虽然作为一门艺术,却有很强的可计算性,音乐模式背后蕴含着数学之美。常规的作曲技法,如:旋律的重复、模进、转调、模糊、音程或节奏压扩,和声与对位中的音高纵横向排列组合,配器中的音色组合,曲式中的并行、对置、对称、回旋、奏鸣等等,都可以被描述为单一或组合的算法。这从本质上决定了,AI技术可以较好地应用到音乐创作上。久负盛名的人工智能音乐作曲系统EMI,就是通过对作品进行分解,以新的排列来复用这些结构进行重组,获得不同风格的新音乐。
其实,早在上个世纪60年代,就已经有计算机与传统音乐之间结合的尝试,直到广泛研究智能算法的热潮兴起之后,许多基于机器学习神经网络的开源项目浮出水面,AI技术有了长足的进步,越来越多的人关注到这个科技与艺术奇妙结合的领域,计算机音乐与传统音乐的桥梁才逐渐架设起来。
虽然是freestyle,也有一些作曲技术模型
人工智能在作曲主要基于以下几种模型:分形音乐模型、马尔可夫链(Markov chain)模型、遗传算法(Genetic Algorithm)模型、人工神经网络(Artificial Neural Networks)模型和各种基于规则知识的改进或混合模型。
1、分形音乐。它表明音乐完全可以通过数学算法进行创作。分形音乐是几何学在作曲中的应用,但是只能创作一些较为简单的作品。
2、马尔科夫链。由于建模简单,可以即时产生新音乐,所以一直被广泛用于商业程序上,也大量出现在互动音乐艺术家的作品和即兴演出中。它基于随机过程、概率逻辑的有限控制方法,尤其是使用马尔科夫链结合一定约束规则,在统计的基础上对音乐的未来走向进行概率预测与风格边界限制。
3、遗传算法。将音符的排列组合进行编码,模拟物种繁殖过程,自动挑选出最优秀的作品。由于具有算法成熟和实现比较简单这两大优势,遗传算法得到广泛关注。但是,用遗传算法进行智能音乐生成,选取合适的评价函数是非常富于挑战性的工作,一定程度上限制了应用的快速发展。
4、人工神经网络。当前AI音乐研究的前沿技术,普遍采用具有深度学习能力的各种改进神经网络模型,来帮助人工智能模型学习样本音乐中的关键元素以及套路。模型充分学习一系列人类己经创作好的音乐,提取和存储音高、音长、音量、音色、音程、节奏、调式、和声等关键特征,即可按照要求大量输出有类似特征的新音乐。例如,Google Brain做的在线交互钢琴只需要识别当前任意类型的少量音乐,就可以根据音乐的相符度进行预测,实时输出自动弹奏出搭配音乐。
创造AI的freestyle,它的难点在哪?
目前AI作曲领域研究的方向主要在深层特征的提取与应用和混合系统的构造上,还面临以下几个难点。
1.音乐的表示问题。音乐组曲过程较为复杂,现有特征提取机制尚不能够精确掌握一部作品的全部信息,比如,作品中与乐句、调性等相关的音乐信息一般体现不出来。如何精准表示音乐的细部特征、提取音乐的深层逻辑、建立表层结构和深层逻辑的关系,是AI作曲亟待解决的基础性问题。
2.学习与创造的问题。通过大量学习而建立的作曲系统,能否“灵感一现”,合理地突破预置规则,尝试使用不同方式创造性地作出一些风格独特,更生动、更具吸引力音乐作品。如何进一步激发AI的创造性,实现从按照规则制作到突破规则创作的转变,是AI作曲面临的一个技术难题。
3.创作作品的质量评估问题。人类对音乐作品的评判往往比较感性,因此作曲系统中的质量评估机制是一个非常重要的部分,它往往会引导创作的方向,甚至最终决定作品的成败。把人类的审美观用机器能够理解的语言描述出来,建立有效的评判标准是研究人员首要面对的问题。