“人工智能解读唇语不止能解码语音和语言翻译”-雪球新闻网

{/dede:field.body}

据外国媒体报道，新的语音合成器可以跳过语音记录，将说话者的嘴巴动作直接转换成句子。研究人员表示，该装置能帮助声带麻痹患者发声，并能更进一步进入智囊机接口。解释该装置的研究发表在《plos计算生物学》杂志上。

这项研究的作者来自法国国家科学研究中心。据复制，该语音合成器将人体主要的语音发音器(舌、颚、口、唇)的动作转换为智能语音。记录说话者的发言和嘴巴各个部位的位置，并通过人工智能互联网算法进行分析。

这里采用的人工智能算法是基于人脑建模的深层神经互联网( dnn )。算法设计比较多和复杂的模式识别。这个深层神经网络dnn通过测量舌头、下颚、软腭、嘴唇的协调动作(也称为发音声音信号)来识别嘴正在发音的语言。

作者解释说，dnn计算模型训练这些测量数据，将发音语音信号转换为声语音信号。在这项研究中，我们请用来训练dnn模型的客户和陌生的新客户测试了语音合成器的实时控制性能，判断了它是否能成为智能机接口的一部分。

语音智能机接口通过解码皮层的语言相关活动，实时控制语音合成器，帮助有严重发声障碍的人恢复交流。为了帮助也不能振动通道的患者说话，科学家必须掌握如何对大脑信号进行解码并翻译成语音。

谷歌不久前推出了多语言机器翻译系统。该系统成为zero-shot翻译系统，具有自我学习能力。这可以将未学习的两种语言翻译成已经学习过的语言。这意味着，通过人工智能训练学习如何将x语言翻译成y语言后，系统很快就会自动掌握x语言到z语言的翻译。

google brain的博文将这种翻译技术称为神经机器翻译系统( google neural machine translation，简称gnmt )。

标题：“人工智能解读唇语不止能解码语音和语言翻译”

地址：http://www.xiaolihe.cn/xqsmkj/2277.html

“人工智能解读唇语不止能解码语音和语言翻译”