当前位置: 安徽新闻网 > 图片新闻
“中国声谷”语音产业发展高峰论坛上,专家企业家研讨智能语音技术及产业发展——
让“能听会说”的机器造福人类
来源: 安徽新闻网-安徽日报 2021-04-28 09:13:09 责编: 刘东伟

航拍的安徽创新馆。

未来智能语音技术如何变革,产业怎样发展?4月27日上午,在安徽创新馆内举办的“中国声谷”语音产业发展高峰论坛,来自高校、科研院所和企业的代表对此进行了深入研讨。

谈起智能语音,另一个关键词就是“人工智能”(AI)技术,正是AI技术的发展,给语音技术和产业发展插上了智能翅膀。

论坛上,东南大学首席教授曹进德提出了关于“群智系统”的相关概念。他在《群智系统与网络》的主旨报告中提出,群智系统与网络的理论和技术是AI2.0时代的重要研究课题。

“比如‘树上有100只鸟,打了一枪后还有几只鸟?’群智系统研究的是四散的鸟儿从无序到有序逃离的问题,也就是群体从局部的、无序的相互影响,到全局的、协调的动力学行为。”曹进德用一个例子形象地说明群智系统要研究的对象。

机器做决策、处理问题时,可能会面对各种随机性和复杂环境,AI的科学决策离不开群智系统的参与。曹进德认为,从鸟儿的成群逃离,到狼群的协同捕食,群集智能其实是一种生物启发的智能,通过向动物学习智能,再运用各种精密的算法,可让人工智能有效应对复杂环境下的不确定性因素,做到科学正确的决策与运行。

当前,群智系统在智能电网、智能交通、无人机集群协同等方面应用广泛,有着良好的产业前景。

除了专业的学术分析,还有企业家关于新科技、新成果的生动阐释。科大讯飞总裁吴晓如介绍了讯飞最新的语音技术和成果。

吴晓如介绍,目前,科大讯飞在语音识别、语音合成、机器翻译等方面取得了很大进展。比如通过讯飞语音合成技术,可以让机器人模拟母亲的声音给孩子讲故事;机器口译技术助力无障碍沟通与阅读,讯飞翻译机可翻译60多种语言,讯飞扫描词典笔可以实现多语言无障碍阅读等。

给智能汽车下达命令,告诉机器人你想让它做什么……人机交互不再是以往的“按按钮”,而是“说说话”。“语音交互成为万物互联的重要入口,是核心技术的必争之地。重要的技术要把握在自己人手上,才能防止技术被‘卡脖子’。”吴晓如说,随着5G技术的应用,科大讯飞正致力于语音交互的技术研发与攻坚,相信未来会有更多更智能的新技术新产品诞生。

语音技术不仅能给机器下命令,是否还能合成语音?我们的声音能不能被克隆?中国科大电子工程与信息科学系教授、博导凌震华在论坛上分析了语音合成方面的新进展和新技术。

凌震华表示,语音生成是一种感知智能,最初级的就是输入文本转化为流畅的语音,而高级的就是通过大量的声音数据库,制作出模仿他人的合成语音。凌震华现场播放了一段模仿一位网络红人的合成语音音频,足以“以假乱真”。

凌震华表示,假音检测技术不断发展的同时,新的合成技术也在同步形成。可以说,语音合成技术既有机遇,也面临挑战。

讲台上,一轮轮精彩演讲轮番进行;台下听众聚精会神聆听。

值得关注的是,现场大屏幕边缘有两块屏幕显示的“同步字幕”,是演讲者1秒前刚刚说出的话。语音识别技术的准确性之高、识别之快,令人惊叹!

本网记者 王弘毅

    相关新闻