美文网首页
人工智能:语音合成技术

人工智能:语音合成技术

作者: 0清婉0 | 来源:发表于2021-01-23 18:51 被阅读0次

近年来,国内巨头们也纷纷开始布局智能音箱(百度 Raven 、阿里天猫精灵、腾讯听听、京东叮咚、小米 AI 音箱等等),相信不少同学都已经入手;同时,越来越多读书 APP 提供“听书”的功能,甚至出现将小说转有声小说的软件;手机里的语音助手、电脑里的 Cortana、车载导航中说话越来越像真人,甚至感觉偶尔说话很有“感情”。这些应用背后都有用到了同一种技术——语音合成(TTS,即Text To Speech)。

语音合成一般会经过文本与韵律分析、声学处理与声音合成三个步骤,分别依赖于文本与韵律分析模型、声学模型与声码器。其中文本与韵律分析模型一般被称为“前端”,声学模型和声码器被称为“后端”。

文本与韵律分析中,首先对文本进行分词和标注:分词会将文本切成一个个词语,标注则会注明每个字的发音以及哪里是重音、哪里需要停顿等韵律信息;然后根据分词和标注的结果提取文本的特征,将文本变成一个个文本特征向量组成的序列。

目前百度语音技术是JAVA IDE语音合成技术。

相关文章

网友评论

      本文标题:人工智能:语音合成技术

      本文链接:https://www.haomeiwen.com/subject/ljpuzktx.html