我们什么时候才能发明《星球大战》里的机器人R2-D2和C-3PO?

《星球大战》的宇宙中充满了机器人,随处可见医疗、探索、劳动、飞行甚至战斗机器人。它们有明确的任务,通常有一定程度的独立性,不需要与人交互。现实生活中,我们现有的技术能制造出上述大多数机器人。但是那些还能与人交互的机器人呢?当谈到R2-D2、C-3PO以及《星球大战:原力的觉醒》中的新角色BB-8这样的机器人时,答案更多是喜忧掺半。

《星球大战》中这两个最著名的机器人本身就有不同的任务,R2-D2是一个驾驶和修理飞船的宇航技工机器人,C-3PO是一个通晓语言和礼仪的礼仪机器人。它们两个长得完全不一样,C-3PO是成人模样,而R2-D2则是装有轮子的小垃圾桶。但是很显然它们的社交能力让其拥有意识且成为令人喜欢的队友。就行走、说话、感知环境来说,我们越来越接近所需的功能。比如谷歌Atlas和NASA的Valkyrie等人形机器人已经能很好地行走(甚至跳舞)。目前语音识别与合成的水平也在迅速提高,比如微软最近将语音翻译融入了 Skype中。诸如计算机视觉、甚至人工鼻等感知技术也越来越接近人类。

说话并不容易

不幸的是,无论是人形的C-3PO还是用轮子滑行的 R2-D2,构建其基础技术模块几乎是最简单的部分。真正的挑战是将这些零件组装起来,让机器人拥有社交能力。
要明白为什么这件事这么难,只要想想人们面对面交谈时会发生什么就知道了。我们的声音、面部表情和肢体语言都十分丰富。大量的信息都是靠非语言信号传递的。这意味着像「可能」这样一个简单的词的意思,会受说话人所作的所有事情影响。
现实世界的沟通都是有语境的,其他人随时可能加入也随时可能退出,而这期间所发生的每次交互都会产生巨大影响。因而,机器人不仅要理解人类沟通信号的所有细微差别,还要做出合理的回应。这是一项巨大的挑战。
因此,即使最先进的机器人,也通常是在受限的环境中运行,比如实验室。它们的沟通能力有限,只能进行特定的交互。所有这些限制虽然减少了机器人必须理解和产生的信号的数量,但是却增加了自然社交的成本。

这个出故障的小家伙,都是它的错。(星战4中C-3PO说的话)Mario Anzuoni ——图注

机器人和销售

然而,显然人们对具有更多社交功能的机器人有强烈的购买欲望。已经上架销售的机器人Pepper(日本生产的真人大小的机器人)能够回答问题、遵循指令以及对情感和面部表情做出反应。2015年7月以来,日本本国民众的消费热情十分高涨,不到一分钟之内每个月1000台的定量就被抢购一空。
同时,2014年7月在众筹网站Indiegogo上发起众筹的机器人Jibo在上架不到一个星期就筹集到了100万美元(70万英镑),而现在它已经筹集到6000万美元。Jibo由美国麻省理工大学(MIT)发明,这个仍未发售的机器人能与人交谈,认人并记住其偏好。

Pepper:带我去见你们的经销商。Mike Blake -图注
然而,这些成功的消费品依旧不能像我们最爱的星球大战机器人那样进行有效的交互。要发明像 C-3PO, R2-D2和BB-8这样具有真正社交能力的机器人,似乎另一个高度活跃的领域——数据科学能帮得上忙。
我们早期对交互机器人的尝试通常都基于预设程序(「如果人们说X,回答Y,否则,回答Z」)然而,最近,机器人发明者转向了机器学习:记录人与人或人与机器之间的交互,然后基于数据所显示的「教」机器人如何行动。这让机器人更具灵活性和适应性。
机器学习也取得了巨大进步。以前机器人只有在录入了被处理的数据之后才能「学习」,而更新的技术诸如深度学习能让机器人从原始数据中学习如何行动,这将使它们更具开放性。这些技术已经对语音识别和计算机视觉产生了深远的影响,谷歌最近开源了其内部深度学习工具包TensorFlow,这让全世界的研究者都从中受益。
总之,要发明如 R2-D2和 C-3PO这样具有完整社交能力的机器人,依旧任重道远。恐怕我们有生之年也不会见到完整版本。但好在这是个十分活跃的研究领域,数据科学技术正飞速提高着机器人的社交能力。在不远的将来,我们能获得令人激动人心的成果。

来自theconversation,作者Mary Ellen Foster(格拉斯哥大学计算机科学系讲师)。机器之心编译出品。编译:孟婷



精彩评论 0

还可以输入100个字,评论长度3个中文字符以上
95919000:2017-08-21 18:03:14