第二章 AI复兴:深度学习+大数据=人工智能(第13/20页)
2012年6月,谷歌大脑初战告捷。据当时的《纽约时报》报道,谷歌使用了一个拥有16000个CPU的大规模计算机集群,让计算机用深度学习模型自己“看”了一千万段You Tube上的视频,然后,计算机自己“学”到了如何从视频中辨认一只猫45!
谷歌大脑的创建者杰夫·迪恩在介绍谷歌大脑团队时说:“我们专注于建造可用于机器学习的大规模计算系统,以及进行高级机器学习研究。我们同时拥有这两方面的人才,而他们联合起来解决问题,这常常会带来显著的进步,这种进步是只具有机器学习技能或只具有大规模计算技能的人无法单独取得的。我认为这是我们团队取得众多成功的原因之一。它使我们既在这两个领域取得成功,也让我们能够将‘为问题投入多少计算’和‘如何为我们关心的问题训练大型、强大的模型’方面的最高水平进一步提升。”46
谷歌大脑的第一个版本建成后不久,吴恩达就离开谷歌,转而帮助百度开展人工智能技术研究。深度学习大师杰弗里·辛顿则在谷歌大脑项目成立的第二年加入了谷歌,主持谷歌大脑团队中的理论研究。同时,杰弗里·辛顿仍继续他在多伦多大学的教职。他目前的生活被分成了两部分:在多伦多的科研和教学生涯,以及在谷歌贴近产业前沿的研究实践。最初,杰弗里·辛顿并不想正式加入谷歌,他只想利用休假时间,试着在谷歌工作三个月。为此,谷歌不得不先与他签订了一份实习生合同。这样,深度学习领域数一数二的大师级人物杰弗里·辛顿,就以一个普通实习生的身份来谷歌上班了。杰弗里·辛顿说:“直到有一天,有人在午餐时对我说:‘辛顿教授!我选修了你的课!你在这里做什么?’自此以后,再也没有人质疑辛顿作为实习生的存在了。”47
今天,有深度学习助力,有基于互联网的海量数据支撑,有数以万计的强大计算机集群,谷歌大脑正在帮助谷歌公司解决横跨多个领域的几乎所有人工智能的相关问题:谷歌的搜索引擎正在使用谷歌大脑优化搜索结果的排序,或直接回答用户感兴趣的知识性问题;谷歌的街景服务使用谷歌大脑智能识别街道上的门牌号,以进行精准定位;使用了谷歌大脑的谷歌翻译平台在2016年连续取得翻译质量的革命性突破,将全世界一百多种语言的相互翻译质量提升了一个层次;谷歌自动驾驶汽车正基于谷歌大脑对数百万英里的行驶记录进行训练,以改进驾驶策略,保证绝对安全……
谷歌大脑是谷歌公司人工智能优先战略的核心,也是类似谷歌这样的顶级科技公司在人工智能方面全力投入的一个缩影。国内的高科技企业,如百度、阿里、腾讯、华为、小米、搜狗、滴滴、今日头条等,都在近年纷纷建立了人工智能研究团队,搭建了类似谷歌大脑的大规模深度学习集群,而这些集群已经在诸多产品中发挥着深度学习的神奇效能。
AI小百科 什么是深度学习?
第三拨人工智能热潮源于深度学习的复兴。那么,到底什么是深度学习?为什么深度学习能让计算机一下子变得聪明起来?为什么深度学习相比其他机器学习技术,能够在机器视觉、语音识别、自然语言处理、机器翻译、数据挖掘、自动驾驶等方面取得好得多的效果?
从根本上来说,深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。
好了,好了,我知道一提“数学”二字,读者就会跑掉一大半,更别说让非理工科专业的人摸不着头脑的“建模”一词了。有没有可能用非理工科专业也听得懂的术语,解释一下如今在人工智能领域如日中天的深度学习算法呢?
首先,深度学习是一种机器学习。既然名为“学习”,那自然与我们人类的学习过程有某种程度的相似。回想一下,一个人类小朋友是如何学习 的?
比如,很多小朋友都用识字卡片来认字。从古时候人们用的“上大人、孔乙己”之类的描红本,到今天在手机、平板电脑上教小朋友认字的识字卡片app,最基本的思路就是按照从简单到复杂的顺序,让小朋友反复看每个汉字的各种写法(大一点儿的小朋友甚至要学着认识不同的书法字体),看得多了,自然就记住了。下次再见到同一个字,就很容易能认出来。
这个有趣的识字过程看似简单,实则奥妙无穷。认字时,一定是小朋友的大脑在接受许多遍相似图像的刺激后,为每个汉字总结出了某种规律性的东西,下次大脑再看到符合这种规律的图案,就知道是什么字了。