谷歌的人工智能deepmind又很厉害了。
最近,deepmind部门与牛津大学的研究人员共同创造了记录。 在测试的上千个小时的bbc视频剪辑中,deepmind ai实现了46.8%的读唇识别复制精度。 46.8%的人可能觉得不太牛,但实际上经过训练的人类读唇专家的正确率也不过12.4%。
牛津大学的研究开发小组于本月早些时候发表了一份报告。 首先,他们开发了一个叫做lipnet的唇读软件。 其测试成绩为93.4%的精度,似乎比deepmind ai还要高,但实际上这是在特制视频的条件下完成的,测试语句都是公式化的。
深度迷你游戏不一样。 一边看电视一边测试。 也就是说,片段是随机的,片段中人物的声音是随机的,更具挑战性。 为此,deepmind ai经过约5000个小时的训练,包括大量的信息节目在内,锻炼了看、听、读、加油的能力并进行了学习。
根据deepmind的研究,ai在实现更强大的语言学习能力的同时,还具有广泛的应用价值,如聋子理解自然对话、诠释无声电影、集成到siri和alexa等语音助手中等。
当然,也有人对这项技术感到恐惧,认为它是更方便的监视技术。 但研究人员表示,该技术需要在明亮、高分辨率的视频画面上工作,目前的监控视频没有操作条件。 无论如何,ai越来越聪明是件好事。
来源:雪球新闻网
标题:“谷歌DeepMind人工智能 学会读唇语让监控变“监听””
地址:http://www.xiaolihe.cn/xqsmkj/2295.html