深度学习面对物理世界无能为力?包教包会的元学习或是解决方案AI学院

来源: 脑极体 / 作者:我堂堂一个熊猫 / 2018-07-12 21:50
我们所面临的这一次人工智能崛起,来自于数据量的增长和深度学习发展,传感器为智能体打造一个完全结构化的数据世界,再从中抽取规律,让智能体可以自主作业。

我们所面临的这一次人工智能崛起,来自于数据量的增长和深度学习发展,传感器为智能体打造一个完全结构化的数据世界,再从中抽取规律,让智能体可以自主作业。

 

这样形成的结果是,人工智能进入物理领域要比进入虚拟领域困难的多。我们可以看到处理图像、语音、文字等等数据的AI拍照、语音助手、智能推荐表现都很优秀,可在工业、自动驾驶等等与现实世界相交的领域,却因为需要大量测试训练而进展相对缓慢。至于看护机器人、服务机器人这些灵活性更强的领域,人工智能的表现就更加差劲了。

 

 

原因在于物理世界缺乏较好的数据结构化条件,所需解决的问题又有极大的灵活性,就让人工智能的学习和训练变得格外复杂。具体来讲,在极端情况下我们可以教会机器人手臂把水壶里的水倒在水杯里,但一旦水壶或水杯的位置产生了变化,机器人的动作就会一团糟。

 

但如果我们把水杯和水壶可能出现的每一个位置都作为数据输入,对机器手臂进行深度学习训练,这其中的工作成本是难以想象的。

 

 

深度学习“衰落”?元学习崛起

 

在最近,很多人都在讨论所谓“深度学习”的衰落,其中提到的一个原因就是物理世界中深度学习能解决的问题是有限的,如果只依靠传感器收集数据、再从数据中挖掘规律,成本会高居不下。

 

所以我们想象中在家中走来走去满足人们需求的小机器人迟迟不能出现,推荐算法对我们的深入了解却让人毛骨悚然。就给人一种“深度学习让人工智能往奇怪的方向发展”的观感。

 

但深度学习不能做到的,不代表人工智能不能做到。在意识到了深度学习的缺陷之后,很多研究机构和企业开始试图用更少的数据和更简单的训练过程来解决物理世界的人工智能问题。

 

在理想状态下,人工智能的学习应该和人类学习一样。当我们学习拿筷子、系鞋带这类动作时,通常都是通过别人的示范之后学会,而不是精确计算出每一根鞋带之间的距离要有几厘米。

 

实现这一目标,采用方式通常被称为“元学习”(Meta Learning),元学习具体指的是让智能体掌握的能力不局限于某一环境下的某一模型,而是真正掌握学习的能力,让智能体可以从容应对种种新任务,节省下复杂的收集数据、训练模型的过程。

 

 

看一眼就会的机器人,

距离我有多远?

 

这样的描述或许有些难以理解,但我们可以从元学习的一种具体解决方案来解释——一眼学习(One Shot learning)。

 

一眼学习就是我们所说的,和人类一样看一眼示范就能学会动作的能力。以往来说让机器人模仿人类的动作并不是什么新鲜事,但想要让机器人的模仿行为可以应用到现实中,需要至少两百次专业示范的数据,还要将人类的动作逻辑和机器人的部件进行一一的映射。

 

但在UC Berkeley人工智能实验室的研究中,采取了未知模型学习和模仿学习结合的方法,先用大量操作示范建立数据集,从中提取基础的操作策略参数,再给智能体进行单一的一次示范,智能体就可以从中找到对应的位置模型操作策略,从而可以通过一次示范,就能让机器人操纵从没见过的物体了。同时这一切都是通过计算机视觉进行的,利用摄像头或者视频录入都可以。

 

目前通过一眼学习,UCBerkeley人工智能实验室已经实现了让机器人一眼学会分辨不同颜色的球体并放入纸杯、移动物体、堆叠物体等等。

 

除了一眼学习外,元学习还有很多其他解决方案,例如用记忆增强神经网络和顺序生成神经网络帮助智能体从少量数据样本中泛化概念的“少数据学习”,又比如将元学习建立在增强奖励机制之上,以更强的奖励/监督机制让智能体从少量样本中得到高强度的训练等等。

 

 

元学习从实验室进入现实还有多远?

 

目前看来元学习基本都还停留在实验室当中,尚未进入现实应用。不过在产学结合格外紧密的今天,元学习进入我们身边并不遥远。

 

但目前来看,元学习距离实际应用还有以下这些问题需要解决:

 

第一点是元学习数据库的建立。不管是一眼学习还是少数据学习,虽然在训练过程中大大精简,但进行训练之前依然需要建立示范数据集。虽然元学习的数据集相比其他技术模型的数据集更具有通用性,但建立的过程依然是个大工程。如果出现当年李飞飞和Image Net那样极具号召性的数据集工程,或许可以进一步推动元学习的发展。

 

第二点是动作序列的连续性,今天元学习虽然已经可以成功地完成快速动作学习,但所能执行的都是一些非常简单的动作,比如分拣、物品移动等等。元学习虽然提升了训练效率,但这些简单动作用其他训练模式执行也非常简单。如何利用完成元学习动作的衔接或执行更复杂的工作,是让元学习帮助人工智能进入物理世界的关键。

 

目前来看,元学习最大功效是让降低物理世界应用人工智能的成本的门槛。像是自动分拣这项简单的工作,虽然技术程度不高,但往往也只有大型工厂才能应用上。因为其中复杂的训练过程和对应用环境数据结构化的高要求,形成了很高的成本,只有在大型生产活动中才能摊平成本。

 

而对元学习来讲,出去示范动作训练集这一项“共用成本”,企业应用起来几乎是不需要任何成本的——不需要专业人士对机械进行复杂的调试,也不需要在生产线上加入各种传感器,任何人都可以进行示范,做人工智能的老师。

 

从元学习的发展我们可以看出,相比理想状态,深度学习的应用成本还是非常高的。但人工智能的发展趋势,一定是不断向低门槛、低成本的方向流动,元学习就是解决途径之一。

 

或许到了未来,人工智能会变成一种唾手可得的资源,让科幻电影里机器人可以陪伴每一个人。
 

阅读延展

1
3