您的位置: 旅游网 > 时尚

2018全球自动驾驶论坛科大讯飞刘俊峰人

发布时间:2019-09-13 05:00:46

  【2018全球自动驾驶论坛】科大讯飞刘俊峰:人机交互语音识别技术对汽车智能化的影响与推动

  1月日,2018全球自动驾驶论坛在武汉·中国光谷举办,本次论坛以“启发创新·开放共享”为主题,会议期间,科大讯飞智能汽车事业部总经理刘俊峰发表了主题演讲,演讲内容如下:

  科大讯飞智能汽车事业部总经理 刘俊峰

  各位汽车界的朋友、同仁,大家早上好!

  正如华南理工大学欧阳老师所讲,能在今天这么早到这来的都是生死之交,我也是昨天顶风冒雪

  ,合肥到武汉该停的高铁都停了,而我们买的那一班最后晚了6个小时,还是到了武汉,这就是缘份。感谢周晓莺总经理在这么多年以来对于讯飞的支持,我们必须要成为汽车强有力的伙伴,我也希望通过汽车这样的平台向大家释放更多的思考和有关我们的消息。

  今天的演讲从汽车是什么这个角度开始。从1886年第一台奔驰车,汽车的专利被正式宣布,到1908年正式地让汽车从一个贵族的玩具走入平常百姓家,1956年中国第一台解放车下线,代表中国从商用车到世界顶尖的进展到中国第一台红旗轿车1959年10月份参加国庆阅兵,汽车逐步成为人们通行和身份的代表。然30年前满街如果称为豪华车的可能就只有几个,30年过去了这些车十几代的子子孙孙在中国市场上跑着,仍旧是一个交通的工具。现在随着中国设计、中国制造的发展,中国也出现了让世界举世瞩目的设计感和操控感和整个对于真正老百姓的影响力的好车。还有一些新生的造车势力会把一些新的概念、服务体验带给更多的人。作为一个交通工具来讲,它其实已经可以做得很好了,至少能够解决掉我们从A到B很多的问题,此外,它还是一个城市的名片,是我们的玩具,给我们带来很多的工作机会,还是很多自由职业者赚钱的工具。当然,它一方面给我们带来了乐趣、便利,也带走了我们的时间,有的时候还威胁到了我们的生命,很多人都在思考这种问题,尤其你在面对孩子的时候,不禁要思考这个问题,未来得汽车是什么?未来这一代成长到买车的时候,他们需要的车是什么?如果这些问题没有很好地解决,也许下一代人碰到出行工具,这样产品的本身就出现了矛盾。

  很多人都在说,它还是一个交通工具吗?思考到我们最原始、传统的马身上,除了A到B之外,还是人情感交流的伙伴,是我们的战友、朋友,是家里非常重要的固定财产。我们这一代人是跟着变形金刚一起长大的,它是能够保卫我们的一个大家伙吗?更多豪华汽车给了我们他们的诠释,从外观、功能、出行的模式,甚至像丰田这么保守的日系企业都出来说他们的竞争对手不是汽车厂,而是亚马逊、谷歌,他们要干什么?就是从汽车本体上出现了很多延伸,这个行业面临相同的问题,汽车以后可能是什么?

  这里面提到了有可能在出行方式上,和本身汽车属性上会发生深远的变化,它有可能再也不是一个单纯的出行工具,可能是我们喝酒的空间、唱歌的空间、打麻将的空间。作为科大讯飞专注于汽车的交互解决方案,就要思考在未来多变的汽车属性模式下,人和汽车的关系是什么样的?我们要做的交互是什么样的等问题。在中国这个市场上不断地有奇迹发生,中国人的购买能力非常强大,去年我们买走了世界上1/3的车,在这样的销售之上,汽车作为中国工业的代表,还没有完全走到世界的一流水平,如果大家可以再细心地去发现,在世界汽车零部件百强榜上,中国入围的就只有两个,而这两个一个是做轮毂的,一个是做内饰的。而外资公司在占据我们中国以后出行工具上更多财富的时候,我们应该做什么?中国汽车从大到强,应该不是一句空话,我们真的要去思考一下,怎么样从大到强,强什么?

  我们了解到,新车车联的配置比率已经从2016年的16%到了2017年的21%,以中国前装市场的配置数量来计算,去年大概有200多万辆车具备了联功能,无独有偶,去年中国前装市场语音交互的装配量达到了260万,如果联的话,从交互模式上语音一定是必须用的,更多一些服务的连接和一些交互方式的出现,都是为了满足从智能车到联车,到以后更多的模式上,这个产品之中关键的交互方式又是什么?

  汽车“四化”已经提了多年,基本上可以能够明确,这“四化”一个都不会走空。在中国汽车发展政策上2017年尤其集中,如三部委发布的《中国智能联发展规划》等,这些代表国家得重视度,在汽车发生属性转变之后,应该做点什么。在新的命题下,ABC可能真正在汽车之内给我们带来很多交互层面、体验层面、服务层面的变化。

  再来说科大讯飞,截止到2017年已经成立了18年,这一路毁誉参半,尤其是2017年非常精彩,我们被各大媒体或者是各种黑水军不断地推到风头浪尖之上,我们做的就是把人工智能技术带到各个行业中去,从教育、医疗、政法、汽车,从更多我们认为人工智能可以提升效率的大环境上深入布置。我们作为人工智能的国家队,在技术投入上从来没有手软过。去年7月份,我们发布了一个BATI,国家四大智能平台,创新平台,讯飞第一次放在跟BAT同样的位置,而四大创新平台里面强调的各个方向上只有讯飞还在坚持自己的主业,我们就是要把语音互到人工智能做到全球最大。《麻省理工科技评论》给我们全球第一的位置, 而在2016年在Google举办的CHiME大赛上,科大讯飞包揽国际多通道语音分离和识别大赛三项冠军,2017年的7月到8月,先后在斯坦福阅读理解大赛上连续两次刷新世界记录。

  这是从汽车变化开始,大家开始思考更多的汽车之外的事情,核心的词应该是交流。我们提出的方案有两部分,这是我们从整个事业部成立之初到现在一直在禀承的,一方面要给汽车的前端带来更智能的服务,另外一方面要让汽车的厂商主题之内更精益。我们希望不管是从客服解决方案到大数据优化解决方案到系统平台建设,都能给车厂提供更精益的系统解决方案,同时让人和车的交互更智能。

  接下来看下我们讯飞语音核心发展历程,2012年我们正式从中国汽车市场前装开始,到量产,从语音识别到全国PUI的搜索,2014年把车内语音交互的准确率提高到了90%,尤其是降低模块的保证下,能够保证对车内大部分声音的抗噪,2015年能够支持车内更灵活的语音识别,2017年实现了全场景的免换型交互,依托于公司更多的技术资源平台,为汽车带来源源不断的新的技术和新的创新,基本上可以这么说,在2011年之后,中国从语音交互层面,远远地跑在了世界的前端。现在我们能够为整个行业提供几乎无死角的语音交互的系统性的解决方案,从降噪、声纹、语音、搜索,基本上能覆盖所有的语音交互。前装装车量超过200万,在车上使用语音的活跃用户已经超过了400万,这个数字让我们感到非常欣慰,也是这个行业在我们产生变化的时候,能够看好、信任,能够给我们更多的意见。

  除了语音,我们在计算机视觉上亦开始发力,科大讯飞在国际自动驾驶领域权威评测集 Cityscapes 获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录,第二名是Google,这里面吃亏的是有一些我们认为对交通并没有什么影响的地方没有标出来,比如说路上有一些反的牌子盖掉了,车标盖掉了,其他的该看的都看到了,这个算法跑在成熟的量产车平台之上,能够用算法优化能力解决路面分割和360的高清全景。

  这是我们用此系统做的智能泊车影像,在此上面我们可以看到,找到一个车位系统会提醒他这个车位应该怎么样打,打什么样的角落。这一解决方案或许用在在没有那么贵的车,尤其适合新司机。有可能这个时候我们不需要自动泊车,只是用算法做一点点运用的创新就可以解决掉。我们的产品具备能听会说到能察言观色,在汽车的内部和外部全面地感知能力。

  再来讲下我们面向未来的产品布局。

  去年10月9号发布的飞鱼2.0系统上,把原来没有打开更深的思考和更深地能够和外部讲的东西打开了,这个飞鱼2.0关注的是互联服务、场景连接,智能交互、视觉辅助驾驶系统,横向对于环境越来越了解,纵向对于驾驶者状态的关注、状态的监护,最后我们希望能够走到真正的虚拟司机,真正的智能汽车。去年我们重新更新了自己的这一套VI体系,定义了一个新的名字叫飞鱼智行,它是汽车和智能的合成,一条鱼跃在空中我们希望能一跃而起,让汽车和IT和人工智能非常好地结合。

  2.0系统定义的最重要的是懂汽车和懂行的,作为这么多主机厂商背后那个做技术的合作伙伴,我们一定要对这个行业吃得更深,我们工程化交付的整个体系是按照开发完全适配的,整个的过程,不用外行话来解释什么叫联化服务,什么叫人工智能解决方案,在这样一套体系之内就是要站在车厂背后,服务好每一个车厂合作伙伴。2.0的系统框架就是这样子,给车厂定制化开发汽车智能化的信息服务、运营平台,有一个数据的分析平台,分析的AIUI是上面的运用和关联后面的服务,对话引擎是原来的语音助理,飞鱼智盒是对应的硬件系统,如果盲目地在前装做一些产品规划和服务,有可能因为时间的问题丧失到用户最关注的新功能和新服务,所以在我们小飞鱼系列的智能硬件上会优先把一些小想法和可能的智能服务给用户,如果好就放在前装产品上面,如果不好就直接干掉。这就是用后装来叠代前装的过程。

  语音对话的能力,这里面有很多新的元素,这一次我们做到了更窄的波数。可以做到免唤醒,用场景的语意唤醒,你跟他说我要去哪,或者我要听什么歌的时候会优先响应你,主驾和副驾可以抢麦,谁优先唤醒它它就优先响应谁。飞鱼UIAI这一套系统又几个特色:智、快、主动交互,在3.0或者是2.0,非得要说你好XX,XX你好,这个词我们在2011年定义出来之后,现在都变成了大家都接受的唤醒模式,下一步不用唤醒了,真正做到语意化的接入,这是我们不断算法优化实现的。信源群,我们有40多万的开发者,我们用技术换内容、换服务,也有为汽车方向签约的几十个资源方,把它聚合了,变成能够服务各大车厂的服务聚合的平台。以及各车厂每个车厂差异化的品牌服务。

  飞鱼智盒,这个盒子和全球汽车电子定义是一样的,我们感觉到或许它下一步就是一个趋势上一定会出现的东西,从视觉到声音能够做充分地融合性的交互。我们完全可以用算法优化能力把视觉的算法放在这个模块上面,它不是简单地取代一个模块,而是从视觉到声音的交互,从视觉、声音、图象的交互,可以做到更充分地融合。刚才大家看到的那个视频,画线停车,为什么大家感觉到新?因为原来在360环境下,只是把360当成现实性,没有想到我跟360这个显示器能够交互,就可以引发出来更多地从图象到视觉到声音,更多层面的充分性、融合性地交互,这样就更有意思。

  数据工厂,每个人都在抢抓数据,数据有可能是冗余的,这个冗余可能会带来成本,不是价值。另外,数据要充分利用,这个数据要真正标定,同时要安全保护,所有都是强调怎么样更好地利用数据,我们也是几个车厂大数据平台的提供方。这个过程中我们都是一次次不断地尝试,什么样的合作模式是车厂能够接受的,是主机厂真正能够信任的,双方可以背靠背地互相对外说,战略合作这个事情是没有问题的。

  今天讲了三个产品,一是飞鱼对话引擎有新的更新,今年有一些车型就会陆续用飞鱼的对话引擎,飞鱼的AIUI会在前装上更新,另外是飞鱼智盒和还有数据工厂。小飞鱼,这个产品是我们面向未来做无屏化,无按键设计的,作为车内人跟连接更安全的介质,你用常用的功能,基本上是不用掏出来的,用三两句话完成交互的内容,这个产品以后可能在收音机的载体上做简单地融合,就能够为所有的车辆提供几百元水平的智能化解决方案,正好符合了人的需求,不想花那么多的钱买一块装修用的大屏幕,而是把我的用得更好。这个一方面解决是前装市场更好地交互,另一方面解决低端市场跟的连接。

  再次感谢周总给我们提供了平台和机会,也感谢大家听我讲述这么多,过了腊八就是春,给大家拜个早年。在这个冬天希望大家参与到汽车的活动中,感觉到暖暖的春意,谢谢!

  提示:“本文根据发言整理,未经嘉宾审核!” 如需转载或引用,请联系徐先生()

  针对本次会议,汽车进行全程直播,欲了解更多详情可关注以下专题链接:

  PC端:

  移动端:

  本文版权为汽车所有,欢迎转载!请务必注明出处(汽车)及作者。

  文章标签: 全球自动驾驶论坛

小孩经常流鼻血怎么办
小孩爱流鼻血是什么原因
宝宝咽喉肿痛
小孩眼屎多是什么原因
猜你会喜欢的
猜你会喜欢的