当前位置:首页>品牌风采>>正文

重现单田芳原音喜马拉雅用AIGC技术延续经典IP生命力

来源:人民邮电报 发布时间:2023-03-28 14:47:09

1679986066253770.jpg

随着人工智能技术不断成熟、深度学习算法持续演进,运用人工智能技术来生成内容(AIGC)逐渐成为新型内容创作方式。喜马拉雅在现有的“UGC(用户生产内容)﹢PGC(专业生产内容)﹢PUGC(专业用户生产内容)”内容生态之外,探索多模态AIGC的更多可能性。“单田芳大师声音重现”项目是喜马拉雅AIGC的标杆项目,喜马拉雅通过TTS(文字转语音)技术完美还原已逝的单田芳先生的声音,首次用单田芳先生的AI合成音全新演绎听众耳熟能详的经典之作。截至目前,喜马拉雅已上线100多张运用单老AI合成音制作的AIGC专辑,总播放量超过1亿次。其中,有15张专辑播放量破百万次,例如,《民国四大家族》播放量近730万次,《十二金钱镖》播放量近700万次,《卧虎藏龙全集》播放量超390万次。

  这一项目所使用的TTS技术由喜马拉雅珠峰智能实验室自主研发,该实验室定位于新一代数字出版平台技术研发,长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发,由喜马拉雅首席科学家卢恒博士带领。目前,这一实验室已在多种技术的研究和应用上取得了突破。

  喜马拉雅自研的TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型,不仅可以演绎不同情绪的文字,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情感和韵律,这让单田芳先生声音的重现成为可能。为了最大限度保留单老那苍劲、沙哑的独特嗓音以及情感充沛、跌宕起伏的评书腔调,喜马拉雅珠峰智能实验室还通过自主设计单独的韵律提取模块,让单老的AI合成音仿佛本尊再现。近日,“单田芳大师声音重现”项目获评工业和信息化部新闻宣传中心(人民邮电报社)推荐的“2022年ICT优秀案例·超卓互联网应用”,这肯定了喜马拉雅通过技术不断创新内容生产方式、赋能音频行业发展所作出的努力。喜马拉雅已成为音频领域AIGC的先行者,推动着音频行业的技术革新。

  多情感、多风格、多语种声音的TTS技术模型可广泛运用于图书、期刊、报纸、新媒体等多种内容的数字出版、语音修复、语音再现等。另外,AIGC制作速度快、成本低,这极大地革新了音频行业的内容生产方式,让内容生产更高效。目前,喜马拉雅已经与近百家网络平台和出版机构合作,运用TTS技术上线近6万张AIGC专辑,不仅为上游出版产业数字化转型提供技术平台支持,通过数字化分发提高其经济效益,也让下游用户能更便捷地享受边听边看的内容消费体验。(作者:夕文)

(责任编辑:张仁庆)
(审核:吴娜)