当前位置:交游天下最新资讯行业热点语音交互在大众心理期待方面有差距
语音交互在大众心理期待方面有差距

随着AI人工智能技术越来越成熟,语音交互方面的应用也被主流媒体和各大硬件厂商吹上了天。在我看来,这两个原因其实说的是一个问题:智能语音不够智能。

人类的语言是种非常自然的交流方式,它的特性决定了人们一直以来对语言交流的期待。尤其是面对面沟通时,我们渴望立即获得回应,并且最好也是声音反馈。因为语言本身是多变而复杂的,理解自然语言也就需要更高的智力。

我们期待的是和具有相应智力水平的个体进行对话。

这样看来,当下的语音交互存在三个主要问题,它们像是横亘在人们面前的屏障,阻碍人们自然地使用语音来控制设备。这三个问题可以概括为,现今的智能语音不够智能,而人们总是习惯和理解自己话语的人进行自然的语言对话。

这样看来,当下的语音交互存在三个主要问题,它们像是横亘在人们面前的屏障,阻碍人们自然地使用语音来控制设备。这三个问题可以概括为,现今的智能语音不够智能,而人们总是习惯和理解自己话语的人进行自然的语言对话。

语音交互在大众心理期待方面有差距第二张图

问题1:智能语音并不能真正理解人的语言,它不具备人类的智力。

现在的智能语音停留在对关键词的内容识别和上下文分析,而机器是没有“语感”和“情感”的,也不懂得什么语法。这样一来,以人类智力来理解,机器就显得很蠢,而试图和它沟通交流的行为也就显得很蠢。类似的行为其实也适用于文字交
流,一旦对话的情境被建立起来,人们就希望对话者的智力水平足以和自己相当。

现实生活中,也存在着和智力水平不达标的事物进行语言交流的现象,比如和幼童说话、对宠物说话,甚至是对花草树木说话。但这种情况下,人们是不期待获得回应的,低预期也就降低了回应失败的尴尬。

但是智能语音往往被塑造为成年人形象(通过音色设定来塑造形象),让语音交互变得普及也需要建立起用户的预期。而智力水平确实是语音交互最大的短板。

语音交互在大众心理期待方面有差距第一张图

问题2:当人们用语言进行交流的时候,通常希望立即获得回应。

与文字书信不同,语言交流在过去往往是面对面,所以交流是即时完成。即便有了电话之后,语言交流仍然保持着即时性。

有两种形式的语音交流打破了这种即时性:对讲机和即时通讯应用。在这两种场景下,对话者的语言是“互斥”的,不会出现声音的重叠和打断,因此对话者也就没有被置于一个共通的虚拟空间中。它所造成的结果,是这两种形式的语音交流无
法提供面对面或电话交流时的畅快感和现场感,也就缺少一部分“对话”的体验。

与之同理,语音交互因为互斥性的特点,很难被当作是和机器对话。所以Siri式的仿自然语言交流也会缺少对话的现场感。

问题3:语言交流的即时性还有一个结果,就是人们期望对声音的反馈也是声音。

语言沟通是快节奏且高效的,文字表达则有一定的延迟。当一个人处在即时状态下的高效表达时,对方以慢速的文字作为回应会让沟通现场显得不协调。这也是为什么语音交互一定要配以声音反馈,哪怕是你对Siri说“给老爸打电话”,在它
完成这一指令之前,也一定要回应一句:“正在拨打老爸的电话”。

但问题在于,语音合成的技术实力还没有达到人们的期待。生硬的、机器化的声音表达,无时无刻不在提醒着这个对话者是“非我族类”,语音合成的生硬效果也在阻碍着人们将机器视为同等智力水平的个体。(你也许会想到电影《星际穿越》中的机器人Tars,生硬的合成语音效果正是为了突出它的机器人身份。)

当下的智能语音产品中,比较讨巧的办法是先不追求语言沟通的现场感,而将语音作为对机器进行发号施令的一种替代性方式。面对语音识别的设备,人们说出“拨打XX的电话”这样的语音指令,要比说“你帮我打个电话给XX吧”这样的交流方式,少一分尴尬。也正是将语音交互的预期降低,才能让一些喜欢尝鲜的极客们放下心理芥蒂,对机器说出指令。

但如果走在大街上,周围都是同行的路人,你会对着手机语音助手大声说“阅读我刚刚收到的短信”吗?显然不会。因为语言沟通的特性,导致大众对语音交互的期待其实是很难被降低的。

那么语音交互倘若想达到电影《Her》中以假乱真的状态,得先解决好以上三个问题才行。

人类与全智能语音交互的距离会越来越小,无障碍的与机器交流的那一天也不再是遥不可及,想到这里是不是很激动?

未来可期,交游天下APP也接近上线时间 了,让我们一起见证智能语音交互的全新魅力吧。最新动态,请关注我们官网发布的最新消息哦。

作品评论(0)

切换注册

登录

忘记密码 ?

切换登录

注册