详解语音识别技术在汽车上的应用

  • A+
所属分类:音频杂谈

随着语音识别技术应用的不断深化,汽车工程师也在寻求将其更好地整合到汽车系统中的方法。在开发人员将语音作为复杂的人机界面的核心时,控制技术领域必将发生颠覆性的改变。

  语音控制被看作是让驾驶者管理大量消费类电子产品的最可行方式。这种方式可以让人们在做一些相对较复杂的事情时不必将注意力从前方的道路上转移开,比如在M P 3播放器上找一首歌等。

  不过语音识别也不是灵丹妙药。有些操作很简单,只需要用手按一下按钮或拨一下滑动按钮。随着显示屏逐渐成为汽车中控台的核心组件,触摸式输入方式已经成为另外一种操作选择方式。

  事实上,各种控制技术都有其存在和发展的空间。消费者带进汽车的各种电子产品本身也有丰富的功能。随着语音和触摸技术的不断普及,传统的按键也在以新的形式出现,扞卫它们已有的地位。

  据Strategy Analytics公司调研显示,语音和触摸技术市场容量到2015年将攀升到29亿美元。语音控制技术发展最快。目前这种技术逐渐从豪华车发展到主流车型上。

  起亚公司顺应潮流开始在其车型上采用语音控制系统,曾在美国消费电子展上推出了UVO系统。该系统可以让驾驶者管理音乐文件,还可以对手机发出指令,包括发短信和打电话。UVO系统可以学习驾驶者的发音模式,然后不断改进识别的精确度,这样说话人可以使用大量的词汇。

详解语音识别技术在汽车上的应用

  起亚的U V O 系统构建于微软Windows嵌入式汽车软件平台上,这也是福特创新技术Sync系统的基础平台。微软与福特的排他性合作关系已经到期,因此这家软件巨头可以将其语音软件应用到其他品牌的汽车上。

  福特公司也升级了S y n c系统,采用的是语音识别软件供应商Nuance Communications公司提供的软件。新添加的软件可以让用户更加自然地说话,而不只是说几个专门的命令词语。Sync系统目前可以支持一万条命令。

  不能聊天

  虽然语音系统朝着连续语音方向发展,但是驾驶者也无法像与乘客说话那样与汽车进行交谈。这需要更高的处理能力,目前汽车制造商还无法提供。

  车载处理器需要进行声音的过滤,去除道路噪音和车内乘客之间交流的声音。这个要求很难满足,因为汽车级别的芯片运转速度比消费类电子采用的芯片要低。

  “要想让我们的系统理解更多的指令,处理器的速度和内存的大小先要得到提升,”福特公司全球语音控制技术及语音系统主工程师Brigitte Richardson说。“我们在努力改进界面,让其更加自然,但是技术还没发展到那一步。”

  相对于有限的指令语句,计算机搜索对话词汇的难度要大很多,因此这些硬件的升级是非常必要的。首先内存要很大,这样才能存储更多的语句,其次处理器还要能快速地从内存中搜索出与指令匹配的语句。芯片制造商在努力满足这种需求。

  “随着语音识别朝着会话式的方向发展,人们就会期望更多,因此处理器需要更高的主频速度和内存带宽,”飞思卡尔全球汽车驾驶员信息系统市场经理Don Finney说。

详解语音识别技术在汽车上的应用

  他还说,汽车系统中内存总线目前的速度大概为200MHz,而个人电脑上采用的800MHz DDR2和DDR3内存应该在不久的将来会过渡到汽车行业中。

  汽车和消费类产品之间的关系越来越紧密,不过这种过渡也指出了另外一个问题。随着电子行业逐渐朝小型化线几何尺寸方向发展,微处理器的设计成本也随着增加。

  个人电脑、手机及其他消费类电子产品处于不断的发展之中,这也改变了芯片制造商对汽车行业的看法。Strategy Analytics公司估算2009年全球汽车行业对半导体的需求为163.5亿美元,这相对全球2260亿半导体市场来说只是很小的一部分。这也就是说,汽车制造商还需要继续采用为其他行业设计的微控制器。

  “大多数汽车行业用的芯片都已经应用于消费类产品。没有哪家半导体公司会冒险为仅占他们总业务10%的汽车行业专门设计产品。汽车行业相对手机或iPod市场来说是很小的一部分业务。”NXP半导体公司汽车业务开发副总裁Lars Reger说。

选择控制方式

  语音控制可以帮助人们减少注意力的转移,不过还有一些通过手动控制的功能也可以做到这一点。触摸屏取得了广泛的认可,电容式切换技术也取得了发展,在手动输入方面得到了新的应用。系统设计师也在努力寻找如何将手动控制和语音控制的应用领域分开。

  “你不可能全部都采用语音控制,有些操作还是通过按钮操作更简单一些,”博世公司汽车多媒体工程总监Mark Peters说。“如果要按语音输入键的话,为什么不用手直接按下去,然后就可以了。”

  即使是语音技术的支持者也认同,对一些简单的操作来说语音控制并不一定是最好的方式。福特公司成功地将语音控制用于空调系统,这充分展示了这项技术的发展,即从当初一种让人惊讶的新鲜事物发展成为一个非常普遍的功能性工具。

  “调节风扇速度并不是语音控制技术的最好体现,但是在我们当初实现这一点时,它推动了这项技术的发展,也引起了人们的兴趣,”Richardson说。“人们还是喜欢炫耀一下的,虽然按一下风扇按钮要更容易一些,用语音的话,你还要先按一下语音输入按钮,然后再说出指令。”

详解语音识别技术在汽车上的应用

  将语音和触摸结合起来

  随着语音控制的功能性变得越来越强大,新的挑战也出现了。当驾驶员在执行多步骤任务时,比如找到一家饭店并获取行车路线,他们会觉得某些指令采用语音而其他指示通过触摸完成更方便。

  虽然这种方式对消费者来说看似简单,但是实现这种无缝交互的效果尤其复杂。“最终用户总是希望各种功能可以整合在一起,但是如何将它们融合起来非常具有挑战性,”TRW公司首席产品工程师Scott Morrison说。

  今天,许多设计人员都在努力寻找可以将语音和触摸屏结合起来的方法。今天的系统控制结构是这样的:一旦系统进入到语音状态,用户可以发出指令,这时候需要用户完成语音状态下的动作。

  这个时候就很难将系统的语音状态打开,同时还可以准备去接受触摸输入,因为系统需要先关闭语音状态,然后立即进入到触摸状态。如果还需要输入一个指令的话,系统还需要马上进入语音或触摸输入状态,这给工程师造成了更多的复杂性。

  “我觉得语音和触摸屏的结合迟早会实现的,”Richardson说。“但是让消费者在语音状态下可以与触摸屏进行互动从技术上说很难实现。”

  但是开发人员依然要去解决这些问题,他们还要解决汽车应用中的噪音和过滤问题。让人的指令可以被系统正确无误地理解永远都是一个挑战,就好像对人说话一样。

  “有些OEM厂商对是否采用语音控制还犹豫不决,因为车内有各种声音会形成干扰,比如噪音、小孩的叫声以及关门声等,”TRW公司北美车身控制系统销售及业务开发总监Dan Mittelbrun说。“这给语音识别技术带来了很大的挑战。”

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: