11月8日,《中国经营报》记者注意到,在当日所举办的第五届世界互联网大会“媒体变革与传播创新”论坛上,科大讯飞(002230.SZ)董事长刘庆峰表示,在周遭较为安静时,科大讯飞的机器人将口语(此处指汉语)转写为文字技术,准确率已能达到98%以上。
据刘庆峰现场介绍,在机器“会说”方面,国际英文合成大赛是全球公认的最权威的语音合成比赛,共十项指标,在今年7月份的赛事中,科大讯飞拿到九项全球第一,其中最重要的指标是“自然度”一项,唯有科大讯飞拿到了4分,这意味着,其机器读出的英语和美国大学生的平均水平相同。而读汉语,目前的水平约是4.5分。
机器翻译方面,刘庆峰举例大学六级考试中,有一道15分的翻译题,科大讯飞的翻译机能得12.8分。“虽然今天机器翻译达不到最好同传老师的水平,但在日常生活中已经有了很大的帮助。”
机器能理解与思考到什么程度?机器的自然语言理解,在国际上最权威的比赛上,科大讯飞的技术超过了人类平均水平,另一家企业是微软。
而在有噪音、远距离的环境下,机器转写准确率如何?刘庆峰坦陈,在此项国际比赛上,科大讯飞虽是全球第一名,但是有46%的错误率,也就是说,准备率尚不足六成。
“真正地在万物互联时代的噪音环节下,其实我们的技术还有很长的路要走。”刘庆峰表示。在他看来,互联网发展的下一步是从手机互联网到万物互联,噪音和口音对语音识别会提出越来越高的要求。
本报记者注意到,刘庆峰现场提到,语音识别,还可以实现对音视频的快速检索,对大量的媒体资源有盘活作用。“现在科大讯飞的技术,面对腾讯、微博有更多的合作空间。”
刘庆峰现场表示,科大讯飞期待人们去思考人工智能更广阔的应用空间。
刘庆峰认为,在媒体机构,科大讯飞的技术可在采、编、播、审、存整个领域发挥作用,可以让新媒体、自媒体变得更为智能化、实时化,节省出的人力可去做更有创意之事。