当前位置: 首页 > 新闻中心 > 行业动态行业动态

从海外到西南,“80后”青年专家攻坚克难解锁人机交互新模式

发布时间:2022-05-09 08:13:13点击量:

作为中国汽车制造重镇,重庆从来不缺汽车品牌。如今,随着科技和产业变革,智能汽车已经成为重庆汽车产业转型升级的关键点。

今年一季度,重庆汽车制造业对工业增长贡献突出,增幅达16.8%。数据背后,是一批批汽车研发人员的共同努力。在“五四青年节”到来之际,上游新闻记者专访科大讯飞智能汽车重庆分中心总经理马鸿鹏,看“80后”青年科技专家如何带领团队攻坚克难乘势而上,用人工智能赋能智能汽车发展,助力重庆汽车产业转型发展。

从海外到西南,“80后”青年专家攻坚克难解锁人机交互新模式(图1)

入圈:热血青年投身海外市场打拼梦想

2004年,计算机专业出身的马鸿鹏,入职一家日本知名的汽车电子企业,得益于中国汽车市场的快速发展,马鸿鹏很快被派驻到日本合作车企深造。

“当时,我们去这家日本企业,有着60年的汽车行业历史背景,其积累沉淀非常丰富。”马鸿鹏说,此行除了系统性的技术研修外,更重要的是对一款刚引进中国的日系汽车进行新一代智能开发。

彼时才20多岁的马鸿鹏对智能技术正凌云意气,但很快就被泼了冷水。“当时日本的汽车制造技术在全球都是领先的,日方企业觉得我们中方派驻人员只是来研修的,新一代汽车技术怎么做还是得跟着他们走。”马鸿鹏说。

但很快,马鸿鹏就用实际行动证明了自己。

马鸿鹏说,当时国内车载智能系统还处在探索阶段,在新一代汽车智能系统中,他首要想解决模糊检索、实时交通等用户高需求功能,然而那时车机处在封闭系统内,没有网络的情况下,汽车系统本身的算法和存储能力至关重要。

“汽车车机没有联网,当你搜索一个目的地,需要把名称写完整,才能检索到。”马鸿鹏举例说,比如检索“重庆市渝中区行政服务中心”,输入“渝中区行政中心”并不能检索出目的地,必须完完整整地输入。

而要在封闭系统内开发模糊查询,这在当时颇有挑战。马鸿鹏说,这需要提前做好大量的数据,储存到车机硬盘内。随后,马鸿鹏和团队针对全国的道路、地址名称进行关键词切分,并建立索引数据库,进行大规模覆盖性测试,并针对不恰当的分词进行优化。

这项如今看起来习以为常的模糊搜索功能,在当年却是创新之举。“这在当时属国内首创,我们还申请了国家专利。”成功申报专利,让马鸿鹏成就感满满,这也让日本企业刮目相看。

“从担忧质疑到放心交办,我们凭着技术征服日方企业,从而也获得日企的重视尊重。”马鸿鹏说。 

从海外到西南,“80后”青年专家攻坚克难解锁人机交互新模式(图2)

研发:技术攻坚开创人机交互新格局

回国后,马鸿鹏升任公司中层管理,带着20多人的团队干起平台研发。

2018年,中国车市迎来高速发展时期,各大车企各展所长。随着智能汽车人机交互的发展演变,作为中国汽车重要的产业基地,重庆市场备受关注。

马鸿鹏与重庆的结缘,也是从2018开始。

2018年智博会上,科大讯飞董事长刘庆峰宣布将西南总部落地重庆,同时落地的还有科大讯飞智能汽车的重庆分中心,马鸿鹏也成为该中心的总经理。与此同时,科大讯飞还与长安汽车等重庆车企共建联合实验室,在汽车电子智能化的技术研发、产品设计以及整车应用领域展开合作。

“小安你好,帮我查一下北京的天气。”

“好的,北京天气晴,白天气温20摄氏度。”

“再帮我订一张去那儿的机票。”

……

这样的对话,在人与人交流中再平常不过,但对于人机互动而言,想要和机器持续对话,并让机器理解“那儿”就是上文所指的北京,技术难度不言而喻。

“在车内一次唤醒实现多个指令,还要实现上下文理解,这种交互方式是之前没有的,但却是用户的痛点。”马鸿鹏解释到,对于机器来说,机器需要记忆和理解当前说话人的意图和场景,就需要覆盖尽可能多的场景和可能问法,这种会呈几何级数增长的算法复杂度,使软件的开发和维护都有较大难度。

为了实现这一智能操作,马鸿鹏带领着20多人组成的团队入驻长安汽车,反复测试形成庞大的场景知识库,“通常车内常用指令不超过2000种,但我们在车机上内置了常用指令近6000条,不常用指令近2万条,才精准实现用户指令。”马鸿鹏说。

另一项技术难点是,怎样才能让语音控制系统保持收音状态,同时车内对非指令正常交流不作反馈?马鸿鹏说,他们在车内研发设置了声纹识别、声源定位等系统,能够准确识别指令发出者的指令,而非指令者和日常车内交流则不会被接收进语音控制系统,让车内语音操作更加智能和人性化。

如今,搭载这些技术的飞鱼OS已经在长安CS95、CS75等车型上使用,也加速了重庆汽车智能化发展的进程。

从海外到西南,“80后”青年专家攻坚克难解锁人机交互新模式(图3)

攻坚:攻克关键技术助力重庆造汽车走出去

重庆以工业立市,汽车产业是重庆工业的重中之重,是重庆经济的支柱之一。作为传统汽车重镇,重庆在“异军突起”的智能汽车领域如何实现补链强链?

马鸿鹏分析,从国际汽车市场来看,欧美等在燃油车领域的技术和持有率上优势明显,而国内车企的智能化转型及造车新势力的涌入,有望在智能汽车软件+硬件融合方面引领新赛道。

随着智能汽车产业发展,不少重庆汽车品牌也走向国际市场。马鸿鹏说,智能汽车在海外使用,必须适用当地的语种,而在过去外语的车载语音识别及合成系统被国外企业垄断,国内车企只能使用国外企业的语音技术。比如过去很长一段时间长安汽车在面向中东、南美等海外发行的车型中,语音识别系统一直是采用的国外技术,安全问题是最大的考量。

为了解决这一卡脖子问题,马鸿鹏团队联合科大讯飞研究院展开长安汽车车载外语语音识别及合成系统研发。

“做车载外语识别,不仅需要听懂,还要理解其他国家的语言文化习惯,甚至同一语种不同地区的口音,这就需要有强大的识别模型和机器学习做支撑。”马鸿鹏解释说,车载语音的“识别”分为“语音识别”和“语义识别”两个技术层次,“语音识别”相当于人的嘴巴和耳朵,负责表达和获取,而“语义识别”相当于人的大脑,负责思考和信息处理。为此,团队开创性地采用实体抽取+动态模板、融合深度学习的框架,将语音和语义技术剥离,构建出云+端多语种语义平台,基于该平台可快速实现多语种的语义理解。

2021年,这套车载外语语音识别系统成功实现了国产化,长安汽车海外发行的车型均采用这一国产系统,“关键技术的国产化不仅更稳定安全,在生产成本上也实现降低,助力国内自主品牌出海。”马鸿鹏说。

未来:“语音+视觉”开创人机交互新体验

近年来,重庆全面落实制造强国战略,加快推进制造强市、“智造重镇”建设。“身居汽车行业内,我们也在不断思考,如何发挥人工智能优势,通过‘AI+汽车’赋能重庆汽车制造开创新格局。”马鸿鹏说。

随着新技术产品的发布,“AI+汽车”又有了新成果。今年3月,重庆车企欧尚汽车智慧快乐座舱在渝发布,将人工智能技术与汽车使用场景深度融合,打造了全球首发的车外语音交互系统。而这一系统也来自于马鸿鹏的重庆团队。

“以前汽车的语音交互都在车内,实际上车外智能交互也是用户的需求,一门之隔下,研发道阻且长。”马鸿鹏举例说,以往用户在用车场景中,常会有开门难、挪车难等痛点,而这套车外语音交互系统可以让车主在车外唤醒车辆,比如在拥挤的停车场,可以叫它“把车开出来”,车辆即可自动向前驶出,购物归来双手不方便开门,也可以说一声“打开后备箱”,后备箱即可自动开启。

“车外语音交互相较车内语音交互来说,难点在于如何保障车外噪音等复杂环境下,机器能听清楚并执行指令。”马鸿鹏说,为了实现车外的人车交互,他和团队独创神经网络降噪算法和“冷启动”系统两项技术,让车外语音交互系统做到360度语音降噪和无死角识别覆盖,实现稳定高效的车外语音交互。

未来,汽车智能化转型升级之路怎么走?

“汽车革命的下半场是智能化、网联化、共享化。”马鸿鹏说,他正在和团队开发多模态交互的新技术,未来的智能汽车除了在语音交互外,还将增加视觉感应交互。比如,当你看向左边车窗,发出“打开车窗”指令,那么车机将只打开左侧车窗;正在通过中控看地图,说放大一点,车机将为用户放大地图。

汽车产业作为重庆重要的支柱产业,从车端、零部件、电池、软件等全产业链聚集,为重庆在智能汽车领域弯道超车奠定基础。马鸿鹏表示,科大讯飞将发挥人工智能优势,进一步从技术提供商,向信息娱乐系统、音响系统等迈进,走向软硬一体化发展,助力重庆汽车产业智能制造。


Copyright © 2019-2025 2024深圳氢能技术及锂电储能展览会  ICP备案编号:沪ICP备19027886号