大公网

大公报电子版
首页 > 财经 > 商业 > 正文

突破交流障碍 科大讯飞助力冬奥语音翻译

2022-02-10 14:49:00 作者:齐佳萍 李倩 翟婵红
字号
放大
标准
分享


科大讯飞作为冬奥会官方自动语音转换与翻译供应商现场签约(科大讯飞供图)

  1932年洛杉矶奥运会,自动计时系统首次将误差精确到0.01秒;1980年美国普莱西德湖冬奥会,一次尝试开启了“人工造雪”时代;2018年平昌冬奥会,迎来了5G技术的全球“首秀”……而今,冬奥会正式进入“北京时间”,“科技冬奥”也再次站在了舞台中央。

  赛事成绩多语种呈现,跨国界交流无障碍,让视障人士“听见”文字,让听障人士“看见”文字……作为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,科大讯飞为运动会提供自动翻译、多语种语音转换、语音识别以及语音合成等“硬核”技术,用科技说话,助力实现赛场内外的沟通交流无障碍。

  突破“语言关” 交流无国界

  早在2019年,科大讯飞就组建了2022冬奥会示范应用专项团队,围绕“人和人之间沟通无障碍、人和组织之间沟通无障碍、人和赛事之间沟通无障碍”三大方向,加速应用场景落地。两年多来,已先后研发了面向冬奥场景的多语种智能语音识别与合成,具有冬奥特征的多语种机器翻译,以及含冬奥特色的多语种信息获取及交互等核心技术,构建了冬奥会语音语言服务平台。该平台支撑了冬奥虚拟志愿者、便携式终端设备、赛事多媒体办公和信息发布系统等产品在冬奥会上的广泛应用。

  以翻译技术为例,为实现“人和人之间沟通无障碍”,科大讯飞的双屏翻译机可支持60个语种的在线语音翻译、16个语种的语音离线翻译、中英16个垂直行业的翻译。特别是针对冬奥会使用场景,加入了数十万专业词汇以及行业术语,全力保障专业度。



科大讯飞自动语音转换与翻译机展示台(科大讯飞供图)

  突破“手速关” 交流无障碍

  为保障“人和组织之间沟通无障碍”,科大讯飞面向冬奥办公与信息发布应用场景,基于中英文语音转写及翻译核心技术,推出了讯飞听见转写系统。该系统中英文整体转写准确率可以做到95%以上,支持现场上屏发布、媒体采访等,助力实现迅捷的新闻稿发布。

  讯飞听见转写系统,可支持机器对现场语音的实时识别、翻译、记录,并将结果形成字幕投屏展示,形成转写和同声传译的效果,在实时性上突破了技术实用门槛。该系统减轻了对翻译人工服务的依赖,让现场媒体及工作人员不必再过“手速关”,大幅提高了多语种沟通效率与视听体验,在大会场景下具备很好的展示度。

  在此前的奥组委日常办公中,讯飞听见转写系统已经入驻了交通部、志愿者部、服务部等各个部门近50间办公室,迄今已提供超过1000次沟通无障碍服务保障。

  突破“技术关” 交流无限制

  “北京明天的天气如何?”、“速度滑冰女子1000米比赛的场地在哪儿?”、“高山滑雪的男子全能是什么?”……不必费心搜索,这些问题都能在“爱加”上得到答案。冬奥虚拟志愿者“爱加”是个“全能通”,不仅能进行“面对面”的冬奥赛事、赛程实时互动交流,还能陪你玩一把冬奥知识游戏大PK,赛场周边交通、文化、旅游等咨询问答也不在话下。

  在“爱加”大显身手的背后,是科大讯飞提供的语音识别、语音合成、机器翻译和自动问答等技术支撑。然而,由于自动语音转换与翻译涉及技术众多,问题繁杂,科大讯飞在为赛事提供科技力量的过程中,也遇到了不少难点,为此,讯飞从三个领域着力研发,取得了突破。

  在多语种语音语言技术研发领域,由于涉及60多个语种的语音识别合成翻译等技术研发,除了中英文之外,针对小语种语料比较少的问题,讯飞通过源头核心技术创新,在端到端建模和无监督、弱监督训练方面取得了重大突破。例如,在多语种语音识别方面,利用创新技术对100小时有监督数据和大量无标签语音和文本数据进行结合分析,可以达到1万小时有监督训练的效果,可谓“事半功倍”。



冬奥会现场观众使用讯飞语音翻译转换器(科大讯飞供图)

  在语音同传技术实时性和效果的平衡上,讯飞创新构建了“流式的CAAT语音翻译框架”模型,在一个模型内同时解决同传上转写和翻译的两大核心问题,真正实现“又快又好”,对于保障冬奥场景下的语音同传应用效果起到了非常关键的作用。

  在多语种自动问答领域,讯飞融合了数字人生成、语音识别、语音合成、自然语言理解等多项技术,并结合FAQ问答、文档集合问答、知识库问答和基于文本蕴含识别的多源答案验证等技术进行知识库构建,最终让人们可以和冬奥虚拟志愿者“爱加”用六种语言自由互动交流。

 

责任编辑:张菡

相关内容

点击排行