(资料图片)
作者:钱立富 来源:IT时报
7月12日,虚拟歌手洛天依迎来了其“出道”十周年纪念活动,当晚,来自五湖四海的粉丝在通过全网直播在云端陪伴和见证了洛天依迈向新的阶段。活动中的一大亮点是,洛天依首次用AI发声:“唱出你心中的歌,我是虚拟歌手洛天依。”
这一天,人工智能小冰框架与Vsinger宣布达成合作,探索虚拟歌手向AI being迁移的路径,启动了专为虚拟歌手洛天依定制的歌声、语音多个AI声库的制作企划,展示了由小冰深度神经网络歌唱模型(Xiaoice DNN Singing Model)驱动的洛天依。同时,以小冰框架定制的洛天依AI,和X Studio音乐创作软件制作企划正式启动,其中包括洛天依的歌声合成声库,和第一个语音声库,将向广大创作者们推出。
而在为期一个半月的洛天依十周年线下展的现场,参观者可体验到基于人工智能小冰框架驱动的AI洛天依的歌声,并能参与到内测版小冰X Studio音乐创作软件与洛天依AI声库的测试中。未来,洛天依AI声库与X Studio正式上线后,将兼容MacOS和Windows平台、支持多种唱法参数调节、AI一键调参等新功能,界面设计和交互体验也更贴合专业用户的习惯,这将让基于洛天依IP的音乐创作,更加便利和顺畅,也拥有更多声音表现的可能性。
更好的体验离不开技术创新。自2016年以来,小冰团队以DNN为技术基础,持续探索和拓宽人工智能歌唱的上限与边界。基于双方合作,小冰团队率先在洛天依AI声库,通过优化后的小样本学习,就能够完成音色融合、唱法迁移、高品质歌声合成。优化后的小样本学习,是指新模型仅需25首歌曲作为训练基数,就可以达到85%或MOS 4.25以上的声音还原度;音色融合,是指在给定的音色基础上,可更精细地构建声库和调参,创造出无数个质量相同,但音色不同的虚拟歌手;唱法迁移,是指将音频中的音色和唱法信息分离,实现训练好一种唱法模型,就可以快速迁移到任意虚拟歌手身上。这些技术创新,能让小冰框架快速训练出无限个各具特色的高品质虚拟歌手。
未来每个人身边,都将环绕着许多个虚拟人。多年之后回望,小冰框架与Vsinger双向奔赴的一小步,将是AI驱动的虚拟歌手,加速进入大众日常生活的一大步。
关键词: 小冰框架牵手Vsinger 洛天依首次用AI发声