{/dede:field.body}

据外国媒体报道,新的语音合成器可以跳过语音记录,将说话者的嘴巴动作直接转换成句子。 研究人员表示,该装置能帮助声带麻痹患者发声,并能更进一步进入智囊机接口。 解释该装置的研究发表在《plos计算生物学》杂志上。

这项研究的作者来自法国国家科学研究中心。 据复制,该语音合成器将人体主要的语音发音器(舌、颚、口、唇)的动作转换为智能语音。 记录说话者的发言和嘴巴各个部位的位置,并通过人工智能互联网算法进行分析。

这里采用的人工智能算法是基于人脑建模的深层神经互联网( dnn )。 算法设计比较多和复杂的模式识别。 这个深层神经网络dnn通过测量舌头、下颚、软腭、嘴唇的协调动作(也称为发音声音信号)来识别嘴正在发音的语言。

作者解释说,dnn计算模型训练这些测量数据,将发音语音信号转换为声语音信号。 在这项研究中,我们请用来训练dnn模型的客户和陌生的新客户测试了语音合成器的实时控制性能,判断了它是否能成为智能机接口的一部分。

语音智能机接口通过解码皮层的语言相关活动,实时控制语音合成器,帮助有严重发声障碍的人恢复交流。 为了帮助也不能振动通道的患者说话,科学家必须掌握如何对大脑信号进行解码并翻译成语音。

谷歌不久前推出了多语言机器翻译系统。 该系统成为zero-shot翻译系统,具有自我学习能力。 这可以将未学习的两种语言翻译成已经学习过的语言。 这意味着,通过人工智能训练学习如何将x语言翻译成y语言后,系统很快就会自动掌握x语言到z语言的翻译。

google brain的博文将这种翻译技术称为神经机器翻译系统( google neural machine translation,简称gnmt )。

来源:雪球新闻网

标题:“人工智能解读唇语 不止能解码语音和语言翻译”

地址:http://www.xiaolihe.cn/xqsmkj/2277.html