AI认知进阶手册(创业者必读)

现代的人工智能,更像古代的炼金术。

作为一名创业者或者投资人,你该了解的机器学习常识是怎样的?世界知名AI学者邢波教授给出了系统的解答。

目前的人工智能,或者说以深度学习为代表的一些方法论的研究,更像是古代的炼金术,而不像是现代的化学。

—— 邢波

邢波,师从机器学习泰斗级学术大咖 Michael Jordan ,卡耐基梅隆大学机器学习和医疗中心主任,2017年机器学习学术水平排名世界第一。同时,他还是生物化学与计算机科学的双料博士,创立了通用机器学习平台Petuum,并获得了软银投资。

授课老师|邢波

卡耐基梅隆大学计算机科学学院教授

通用机器学习平台 Petuum 创始人

20年前,当我刚进入这个领域的时候,人工智能还处在谷底,是一个比较冷门的、不被重视的状态。那个时候,这个专业叫 ——机器学习。这是人工智能的核心技术基础。

事实上,我更喜欢这个名字,因为它把"人"这个词给去掉了,免除了很多不必要的误解。我就是用一台计算机或者一种设备,来学习某一种能力,这个能力是人的能力,还是其他的能力,并不重要,从而使得这个工作本身更加稳健和专注。

什么是机器学习? P、T、E

人在学习什么东西呢?人的学习可能要更高级一点,它其实包含了对环境变化所做的预测,甚至是预测后面的规则,是人所感兴趣并希望学到的。比如说我们对自然科学知识的学习,就包括了学习它的法则、流程或者语法这些不同的规则,这些都是我们从数据或者从知识环境里面,可以获得的一些学习的套路。

学多了以后,你就会发现,有时候就变成机械化,你不想,就可以反应了。

同样的道理,机器学习的定义是这样的 ——它关注的是怎么能够建立一个通过体验,自动提升自己功能的计算体系或者计算系统。这个计算系统能够通过跟环境交互的体验,自动提升自己的能力。

再详细点说,机器学习的计算系统,包括三样东西:

P
就是性能(performance),机器学习非常重要的一件事儿就是性能,就是"好不好"。
T
就是任务(task),到底是做什么事。
E
就是体验(experience),实际上就是数据或者是获得数据的过程。

接下来的一个关键问题是,机器学习实际上是怎样发生的?

基本上来说,机器学习的流程需要三大因素:一个是要有"环境",环境里面有数据,数据里面包括了音频、视觉、行为等各种各样的数据,还包括了体验;然后就是"感知"(learning),实际上是把这些数据形式化、抽象化,然后再了解里面的关联,甚至了解里面的一些因果关系。数据的表征里面能够获得对于预测的应对关系;最后,学完了以后就需要来做"决策"。

决策的本质就是在一个特征空间里面做边界的划分。

举个例子,如何区分南方人和北方人?由于时代的变迁,如果仅从饮食习惯、外形和身材等维度去区分,不是很容易,但如果增加一个维度或者边界,比如说个北京话绕口令,这个问题就容易解决了。

整个过程的完成,通常无法依靠数学解析,而需要使用适当算法实现一个递归循环的过程,不断地迭代以后希望它能够收敛。

为什么说"希望"收敛呢?在很多情况下,依据数学方程的形式和决策,试了很多次还是收敛不了,那这种情况下就只能看运气了。

所以,选择用什么样的方程,选择最有效的决策,使用什么算法,甚至在什么计算设备上实现,实际上对于机器学习的最后结果的质量是有很大的关系的。

作为一个研发人员,需要具备比较充分的理论知识,才能在算法或者方案不太灵光的时候能够有足够的知识储备找出替代方案,所以知识体系很重要。

怎么实现机器学习?掌握4个要点,拥有更强的实战能力

实现机器学习的手段相当丰富。所以,一个成熟的工程师和研发人员,只有具备系统地结构化的知识储备,才能有更强的实战能力。

所以,在长期教授机器学习的过程中,我有意识地把机器学习的手段,进行了分类,就好比一个书架,把每不同的书给放在不同的层里面。简单讲,是这样的:

  1. 起点,即选择"目标方程"。举个例子,假设要培养小孩,有人会要他上私校、弹钢琴、学数学、参加奥赛……这就是所谓的优化小孩能力的算法。那最终目的是什么呢?这个最后想要达到的结果就叫"目标方程",比如说这个方程最后是小孩考上了大学,或者成为一个成功的企业家。
  2. 结构模型本身,变量之间,有不同的架构和关联。
  3. 限制这个模型是可以在无边界的情况下自由选择?还是只在一个空间里,做有限的选择?有时候,"限制"是好事,可操作性强一点。但有时候,也会损失很多机会。比如送小孩儿上学,需要选学区,还有价格的考量,这些都是限制。
  4. 算法用哪种方法论来实现"目标方程"?包括不同的数学技巧,就好比培养人,是让他学琴还是学数学,来达到育人的目的。
  5. 停止条件什么时候该停下来呢?比如说,是直到小孩考上哈佛才停下来,还是到了30岁就停下来?总之,你不能永远地训练下去,需要有一个跟价值或者跟回报相关的停止条件。

怎么实现机器学习?我们再来用"神经网络+深度学习"来说明一下。

它的起点非常非常朴素 ——人工神经元,神经网络就是好几个神经元变成了一个网络。

什么是人工神经元?在人的大脑里,有一个元件叫神经元,它是一个细胞,包含了细胞核、突触。经过神经学的研究,发现突触实际上就像导线一样,可以跟其他的神经元产生接触,获得信号。而细胞核实际上是一个激活机制,当信号强度达到一个比较高的水平以后,它的离子开关就被打开了,这样可以产生一个电击的信号。

后来,人们用数学的方式,模仿生成了一个有类似功能的组件,即人工神经元。

到了工程层面,可以把抽象的数学描述变得更具体化、可操作化。比如有3个自变量(年龄、性别、阶段)的输入。然后它可以进入下一个神经元,在进入的过程中它其实可以被加权,这叫权重。中间是隐含层,输出还没看到的部分。最后还有一个所谓的阀门函数。比如这个函数是一个生存概率,它健康还是不健康,这就是一个函数。

可以把整个的过程当成一个F,自变量就是X,结果就是Y,但这个F是用了一个多级的组合加权重加域值的方法来定义的F,是一套组合动作,而不只是一个简单的方程,就不是一个简单的线性边界了。

你看,就这一个神经网络模型,就把感知和决策都放进去了。所以,深度神经网络并不神秘,这个深度神经网络里面有很多很多层,根据经验来决定到底多少层是最好的。

总之,深度学习整个的设计,大致是模仿了很多人、动物,或者是一个能够想象的、靠谱的神经系统对于物体的认知过程。

Tips:这些关于"深度学习"的误区,你一定要警惕

作为机器学习的技巧之一,到目前为止,深度学习获得了巨大成功,甚至有人认为,深度学习是全能冠军,所有的任务,深度学习都能有很好的效果。但事实真是这样吗?以下的认知"误区",需要你特别注意:

  1. 深度学习,只是机器学习的技巧之一。除此之外,还有概率图模型、度量学习、核方法等,但是这些手段,并没有获得足够的重视,从而导致产品研发和商业化遇到困境。
  2. 目前的人工智能,或者说以深度学习为代表的一些方法论的研究,更像是古代的炼金术,而不像是现代的化学。我们对中间的道理、原则、原理了解的还非常少。

举个例子:为什么大家最近关注的芯片工业,在中国还无法突破很多技术瓶颈?除了工艺设备的限制,另一个重要原因是因为很多时候我们习惯的研发方式是反向逆推。比如说我们拿到一块进口芯片,设计很精密,通常的做法是,用显微镜把电路全拍下来,拿给工程师,让他如法炮制,最后造出来一个在形式上一模一样的芯片。但是,如果中间出了小问题,比如某个地方的照片没有照清楚或者某个地方加工的工艺不够,出现了一些小瑕疵,整个芯片就突然一下子不工作了,或者效果很差,工程师就抓瞎了,因为他也不知道怎么来调、怎么优化。

原因是什么呢?因为逆向制造的过程,不包含对原理的了解,所以一旦出错,很难恢复。

同样的道理,在深度学习领域也是这样。突然换了一台设备,某个连接跟原来实现算法的情况有点不太一样,算法就会莫名其妙地失效,或者产生一个奇怪的不可预测的反应。比如特斯拉出现的几个自动车事故,就是因为突然出现了原来训练集里面没有的图像,这并不是所谓的功能递减,而是一个彻底的失败,就是因为深度学习内部的一些原理还没有搞清楚。

这就像在现实生活中,比如说教育小孩儿,为了让他40岁能做总裁,你会不断地让这个小孩儿去学钢琴、学奥数、学古文等各种各样的东西。但是,这些因素跟40岁能否成为总裁是否有因果关系,并不十分清楚。这就是目前深度学习面临的最严重的问题 ——训练过程与目标方程中间的因果关系并不是很直接,所以一旦失败,调错就非常难调。

  1. 机器学习领域的研究远未饱和,但遗憾的是,现在学校、工程界或者整个的社会层面,这种打破砂锅问到底的欲望不是很强烈,资源也不是很多,所以造成了深度学习的应用瓶颈。
  2. AlphaGo的胜利是一个可以预料的结果,不必恐惧。

小结:什么才是好的机器学习?

注意,它得是一个能被全面分析和表达的东西,它需要能够被人类理解和感知。

为什么我现在对很多深度学习系统,持有一定的保留态度?因为很多的结果,还不能被解释,当出现功能失常或者事故的时候,你很难去做一个诊断或者手术性的改动。

而这个缺陷实际上对很多系统是致命的,为什么?因为这会使整个研发和部署成本变得相当庞大,而且是很多非专业人员望而却步的。

总之,从事AI领域,你需要谦虚踏实一点。

本文根据5月12日邢波教授在混沌大学的课程整理而成,内容仅为全部课程的1/7。

常见问题

什么是机器学习?

机器学习关注的是建立一个通过体验自动提升自己功能的计算系统,这个系统能够通过与环境交互的体验自动提升自己的能力。它包含三个要素:P(性能,即好坏)、T(任务,即做什么事)和E(体验,即数据或获得数据的过程)。

机器学习的流程包含哪些关键因素?

机器学习的流程需要三大因素:环境(包含各种数据)、感知(将数据形式化、抽象化并了解关联和因果关系)以及决策(在特征空间里做边界划分)。整个过程通常通过算法实现递归循环,不断迭代以期收敛。

实现机器学习需要掌握哪些要点?

实现机器学习需要掌握五个要点:选择目标方程(最终要达到的结果)、结构模型(变量间的架构和关联)、限制(模型的选择空间)、算法(实现目标方程的方法论)以及停止条件(与价值或回报相关的训练终止点)。

什么是深度学习?

深度学习是机器学习的技巧之一,其设计模仿了神经系统对物体的认知过程。它基于人工神经元(模仿生物神经元的数学组件)构建多层网络,通过加权输入、隐含层处理和阀门函数输出结果,是一个多级组合的复杂函数。

深度学习存在哪些主要误区?

深度学习存在几个误区:它只是机器学习技巧之一而非全能;其研究更像炼金术而非现代化学,缺乏原理理解;训练过程与目标方程因果关系不直接,调错困难;且领域研究远未饱和,但资源投入不足导致应用瓶颈。

为什么目前很多深度学习系统存在缺陷?

很多深度学习系统的缺陷在于其结果难以被解释,当功能失常时很难进行诊断或手术性改动。这会使研发和部署成本变得庞大,且让非专业人员望而却步,因此好的机器学习需要能被全面分析和人类理解。