自从人类发现自己拥有制造其他智能的能力的可能性,我们这个物种便对这一主题开始了无尽的畅想和雄心勃勃地探索。
人工智能是阿西莫夫《基地》系列中的丹尼尔,是战胜国际象棋大师卡斯帕罗夫的“更深的蓝”,是《2001太空漫游》中的HAL9000,是嘿一下就出来的Siri。
2018年上半年最后一期主题,寻尝家的小伙伴在一起讨论“人工智能”。本次为我所讲部分的文字整理。
有人说我们现在正处于“人工智能时代”。今天,提到人工智能,有三个词大家肯定不陌生。第一个词是人工智能,第二是机器学习,第三是深度学习。
人工智能、机器学习、深度学习是什么?三者是什么关系?
人工智能是一个广泛而庞大到无法准确定义的概念。偷懒一点说,人工智能是由人制造出来的机器所表现出来的智能。人工智能是目前很多学科的综合,比如计算机视觉、自然语言理解与交流、认知与推理、机器人学等。我们经常用到的面部解锁、指纹解锁、OCR、机器翻译等都都算是人工智能。
机器学习是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。
深度学习是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。单这么说,不好懂。在我理解,深度学习是有层次地认识数据。世界本身是有层次的,几何里,有点、线、面、体,物理中,有夸克、原子、分子,而深度学习就是从不同的层次中理解和认识数据。
一句话概括三者的关系就是:深度学习是一种实现机器学习的技术,而机器学习是一种实现人工智能的方法。

既然深度学习是一种实现机器学习的技术,那么: ## 除了深度学习,机器学习还有其他技术咯? 没错,还有很多浅层学习方法,以及基于逻辑和认知的方法。

浅层学习和深度学习同为基于概率统计的机器学习方法,与深度学习不同的是,浅层学习方法(如决策树、随机森林、支持向量机等)并不具有多个隐藏层。

而基于逻辑和认知的传统机器学习方法更多地是模拟人脑的思维方式,在脑科学、心理学的基础上,用数学模型去模拟人脑的学习方式,跟基于概率统计的机器学习方法是不同的思路。
既然机器学习方法有这么多种,那么:
这么多机器学习方法,为什么要用机器学习呢?
原因在于,一般来讲,在当今大数据的背景下,深度学习方法对大量数据的处理效果优于其他机器学习方法。
在数据量比较小的时候,深度学习的效果相对于传统机器学习方法如支持向量机,并没有明显的优势,而随着数据量的增大,深度学习的优势便越来越显现出来。

深度学习的兴起,有哪些基础?
现在我们出于人工智能的第三波热潮,而这波热潮的重要特征是基于大数据的深度学习。
这波浪潮有三个基础: 1. 数据爆发式增长
训练出优秀的深度学习模型需要海量的数据,而今天诸如Facebook、微博等每天会产生海量的数据,成为人工智能的“石油”;
2. 计算能力大幅提升
深度学习方法会消耗大量的算力,如果计算能力不足,训练深度学习模型会耗费相当长的时间,而现今计算能力的大幅提升,为基于大数据的深度学习成为可能;
3. 深度学习方法的成熟
在本次热潮出现前,深度学习算法有一个硬伤:在神经网络单元饱和之后,会发生梯度损失。就是说模型训练超过一定迭代次数之后容易产生过拟合,就是训练集和测试集数据分布不一致。这就像考试的时候,有人采取题海战术,把每道题背下来,而题目一遍就不会做了。机器记住了每道题非常复杂的做法,但没有抽象出规则。
2006年,Hinton和他的学生在Science上发表文章,解决了这个问题,使得深度学习再次流行。
既然深度学习这么厉害,那是不是说:
## 深度学习方法优于其他学习方法吗? 并非如此。
深度学习模型需要大量的训练数据,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题,此时深度学习方法无法入手,传统的机器学习方法就可以处理。有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法。
## 如何看待人工智能威胁论?
埃隆·马斯克曾发表“AI威胁论”,认为人工智能有可能成为人类文明的最大威胁,呼吁政府快速采取措施,监管这项技术。
与马斯克相对的是,包括扎克伯格、李开复、吴恩达在内的多位人工智能业界和学界人士都表示人工智能对人类的威胁还很遥远。
双方的分歧来源于对人工智能的不同理解。马斯克语境下的人工智能是“强人工智能”(“通用型人工智能”),是具备多类型的任务和适应未曾预料的情形和能力。扎克伯格所说的人工智能是狭义的人工智能,是专业领域的人工智能技术。目前科学界对于强人工智能什么时候会出现,还没有一直的结论,半数科学家及技术研究者认为强人工智能在2045年以前不会出现,而非技术领域的群体则预测它会更早到来。
## 什么是好的智能?
现在的人工智能更像是鹦鹉。人类一遍遍地教它,它可以学会说话,但并不知道自己在讲什么。这就类似于当前的由数据驱动的聊天机器人。
好的人工智能应该像乌鸦一样。乌鸦一般是野生的,需要寻找食物。它找到了坚果,需要砸碎,但这个任务超出了它能够自己完成的能力。大猩猩会使用工具,找几块石头砸开,但乌鸦发现即使是把坚果从天上往下抛,都不能把坚果打开。但乌鸦很快发现,把坚果放在路上,车轧过去,坚果就打开了。但进一步发现,虽然坚果被压碎了,但到路上去吃打开的坚果,却有被车轧的危险。
然后乌鸦开始观察,它发现红绿灯和人车的停下和前行有关系。它领悟到红绿灯、斑马线、行人指示灯、汽车停、人流停这之间的因果链。
搞清楚之后,乌鸦把坚果抛到斑马线上,等车子轧过去,然后等行人灯亮了,它从容不迫地走过去,吃到地上的果肉。
好的智能应该像乌鸦一样。首先,它具有感知、认知、推理、学习和执行的能力,是一个完全自主的智能。其次,它也没有通过大数据进行学习,生命只有一次,它把吃坚果这个任务通过少量数据就形成了模型。最后,它完成这个任务,功耗却十分小。
参考资料
- 腾讯研究院; 中国信通院互联网法律研究中心. 人工智能 . 中国人民大学出版社. Kindle 版本.
- 朱松纯.浅谈人工智能:现状、任务、架构与统一.视觉求索.
- Neural Networks and Deep Learning