云服务

热门搜索: 防爆监控 电动机 防爆暖通 防爆风机

首页 行业资讯 政策解读 电商会议 人物观点 电商数据 电商干货 电商报 博文资讯 客户库 企业库
首页>新闻详情

学不学人工智能,都应该知道这些信息! // 人工智能的冲击

2019年5月15日 来源:防爆云平台--防爆产业链服务平台 防爆空调 防爆电气 防爆电机 防爆风机 防爆通讯 浏览 1833 次 评论 0 次
学不学人工智能,都应该知道这些信息! // 人工智能的冲击

在过去的几年里,人工智能(AI)一直是媒体大肆炒作的热点话题。机器学习、深度学习和人工智能都出现在不计其数的文章中,而这些文章通常都发表于非技术出版物。我们的未来被描绘成拥有智能聊天机器人、自动驾驶汽车和虚拟助手,这一未来有时被渲染成可怕的景象,有时则被描绘为乌托邦,人类的工作将十分稀少,大部分经济活动都由机器人或人工智能体(AI agent)来完成。适当了解人工智能相关信息,可以让我们更宏观地认清现状,学会分辨媒体炒作的可信度。

什么是机器学习

位于美国西海岸的斯坦福大学,是一所为全世界培养了众多著名企业家、经营者的著名高等学府,也是Google联合创始人之一谢尔盖·布林的母校。这里曾经受学生欢迎的讲座之一,是计算机科学系吴恩达(Andrew Ng)副教授的“机器学习”(Machine Learning)。

美国《纽约时报》将这一现象评价为“时代精神的体现”。也就是说,一场即将给你我的生活、工作乃至社会带来巨大变革的技术革命正在水面之下悄悄展开,而高瞻远瞩的斯坦福大学的学生已经敏感地察觉到了这一变革。

人工智能的研究与开发始于20世纪50年代,它是一项为计算机等机器赋予(如人类一般的)智能的技术。进入21世纪后,人工智能技术中的机器学习则成为了发展为迅猛的领域。

机器学习这项技术的定义是,计算机通过分析现实社会及网络中存在的大量数据,从中提取出某种有用的目标模式。此外,这项技术也可以应用于机器人、汽车乃至智能手机等多种设备上,使其获得基于大量数据(通过各种传感器获取)的自主学习能力,进而变得更加智能。

近来,“机器学习”一词已经越来越多地在报纸、电视、网络等媒体上出现,就连平时不太关心这类信息的一般民众也会经常看到这个词。比如,接连击败职业棋手的计算机将棋软件、世界各大汽车制造商争相开发的无人驾驶型汽车、SoftBank发售的曾一度引发热议的人形机器人Pepper等,无论哪一个,以机器学习为中心的新人工智能技术都担任着重要的角色。

Google vs. Facebook vs. 百度

针对以机器学习为中心的新型人工智能技术,技术与资本领先的美国IT企业开始争先恐后地组建自己的研究开发体系。首先,Google在2009年设立了Google X研究所,开始了被称为“Moonshot”的“新一代”技术追梦之旅。

包括现代无人驾驶热潮的发起者、斯坦福大学人工智能实验室主任塞巴斯蒂安·特伦(Sebastian Thrun),美国著名发明家、自然语言处理及脑科学专家雷·库兹韦尔(Ray Kurzweil),以及前面提到的尖端机器学习技术深度学习第一人吴恩达等,诸多人工智能研究者陆续被Google招至麾下,并且带来了惊人的成果(特伦与吴恩达于2014年离开了Google公司)。

与此同时,Google还不遗余力地收购人工智能相关企业。2013年,神经网络研究权威杰弗里·希尔顿(Geoffrey Hinton)设立的DNNResearch公司被Google收购。世界神经网络研究的领头人希尔顿如今除了多伦多大学教授的身份之外,还是Google的特别研究员。2014年,Google又以4亿英镑的估价收购了英国专门进行深度学习技术开发的公司DeepMind Technologies。

对Google抱有强烈竞争意识的Facebook也于2014年设立了人工智能实验室,并招聘了足以与Google的希尔顿、特伦抗衡的人工智能界权威燕乐存(Yann LeCun,纽约大学教授)作为第一任主任。

美国愈演愈烈的人才争夺战,使得中国搜索引擎巨头百度也坐不住了。2014年,百度在硅谷设立了人工智能实验室,其第一任主任正是离开了Google的吴恩达。斯坦福大学副教授吴恩达因其在斯坦福大学任教期间同时参与了Google X项目,并于2012年构建了具有超强图像识别能力的大规模神经网络而闻名于世。

为挖走专门供事于Google的吴恩达,百度提出了“只要你来我们这边,你想研究什么我们都支持,而且不管多贵的研究设备,只要你需要,我们都会提供”的条件。可以说,百度是以三顾茅庐之礼将吴恩达迎入了自己的帐下。

以大数据与IoT为背景

为什么这些的IT企业会在人工智能开发方面下如此大的本钱呢?或者说,人工智能领域究竟隐藏着怎样的商机呢?

其背景在于,现代社会上充斥着的大量数据,即大数据会带来海量财富。文章开头我们提到过,现代人工智能基于机器学习,而机器学习则通过分析大数据来导出某种有用的目标模式。

全世界有超过70亿人,这么多人的日常活动带来了规模巨大的数据。肉体凡胎的人类无法从如此规模的数据中看到什么,但计算机等机器却能够从中总结出某种模式(相关性、规律性、法则性等)。机器学习的优势正在于能从大数据中抽取出上述模式。

在这一背景下,产生了所谓“Internet of Things”(IoT:一切事物均连接在网络上,即物联网)的趋势(图1-1)。我们生活的现代社会中,从20世纪70年代问世的个人电脑到如今的智能手机、平板电脑,进而到电视、汽车,以及今后的可佩戴式终端、智能家居,甚至是智能电网,所有东西都开始与网络连接。

学不学人工智能,都应该知道这些信息! // 人工智能的冲击

图1-1 IoT概念图

这些设备搭载的各式传感器采集了你我生活以及业务中的各类信息,并通过网络发送到巨型企业的服务器(大记忆容量的高性能计算机)上实现累积。机器学习则通过分析这些大数据来导出各种模式,带来商业上的利益。

如今,美国主力IT企业对大数据流通路径的争夺战如火如荼。比如苹果公司将虚拟助手Siri(一款可以用语音操作手机的应用)的标准搜索工具从Google换成了同领域相对弱势的Microsoft的搜索引擎Bing(苹果公司认为,与Google相比,Microsoft更不容易对自身造成威胁)。想必各位都知道,通过分析搜索时使用的关键字,我们能轻松得出当前用户关心的内容。

Google则于2014年1月以32亿美元的估价收购了智能家居领域的一家英国公司Nest Labs。有趣的是,Nest Labs的创始人出身于苹果公司,在Nest Labs被收购前也一直与苹果公司有着很深的联系。Google的这一步棋可以说是将用户全家人的日常生活的相关信息(通过与智能家居连接的网络获得)从苹果公司手中抢了过来。

然而实际上,仅仅注重数据的来源尚有失偏颇,真正重要的是解析数据并导出对企业业务有益的模式。为此,一种专门分析大数据的新兴职业“数据科学家”开始受到全世界瞩目。而在美国,人们更倾向于使用计算机,即让人工智能完成这项工作。

美国从很久以前就频频将“大数据”和“人工智能”两个词成对使用,近来这种趋势愈发明显。也就是说,在解析大数据上,美国正渐渐从人工转向自动化。他们认为(或者说相信),要解析如此大量的数据,人脑已经不够用了,相对而言拥有强大信息处理能力的计算机(AI)更适合这方面的工作。

举个例子。2014年,IBM发布了Watson Analytics。Watson是一台AI超级计算机,当初开发它只是为了在美国著名问答节目《危险边缘》(Jeopardy!)中击败历代人类冠军。后来IBM将其改造为解析大数据的商业机器,通过云计算(将售价昂贵的高性能计算机的功能通过网络廉价提供给客户)为企业客户提供服务。

可见,人们希望将以往由数据科学家(人类)利用计算机进行的分析工作全都交由人工智能完成。Watson Analytics就是基于这种理念开发出来的。

暂且不说将这些事全部交由计算机来做是否现实,至少在现阶段,我们通过以机器学习为中心的人工智能对海量用户产生的大数据进行分析后,能够做到针对个别用户高精度地投放定向广告,或者向用户推荐其可能喜欢的音乐、影视内容以及各式各样的商品等,这其中都蕴含着无限的商机。而这些,正是Google、Facebook、Amazon、IBM乃至Microsoft等公司希望通过机器学习实现的事情。

机器学习的用途扩展

这里举几个具体的例子。比如Amazon的“您还可能喜欢的商品”或YouTube的“您可能感兴趣的视频”等推荐功能,包括Facebook、Twitter等社交媒体上的定向广告也都使用了机器学习技术。它们都是先让计算机对用户以往的搜索记录进行学习,再根据学习内容预测并自动向用户推荐其可能感兴趣的商品、内容、广告等。

机器学习还被应用于智能手机特有的虚拟助手软件上,比如之前我们提到过的iPhone上搭载的Siri,以及安卓等终端上搭载的Google Now,还有Microsoft于2014年在自家手机系统Windows Phone上发布的Cortana(Cortana同时搭载于Windows 10系统)就属于此类。

这些拟人化的软件会借助机器学习能力来分析智能手机的日程表、邮件收发记录、社交媒体的使用日志等,详细学习用户的相关信息,然后根据这些信息,用机器合成的男性或女性声音回答用户提出的需求及问题,或者预测用户在日常各种情况下可能需要的信息并将其自动显示在手机屏幕上。

除了这些身边的在线服务以及小型移动终端之外,越来越多的大型业务也开始应用机器学习,比如汽车、电子工业等大型制造商工厂里的生产管理。面向这些企业,一些专门以SaaS(云计算的别称)形式提供机器学习技术的风险企业如雨后春笋般出现。总部位于美国旧金山的Sight Machine就是其一。

该公司将机器视觉技术(借助摄像头使机器拥有工学视力)与机器学习相结合,并以SaaS的形式提供给大型制造商的工厂(其中包括美国汽车生产商克莱斯勒)。生产商导入该系统之后,检查生产线故障以及残次品等以往需要人工进行的工作(准确地说是通过人眼进行检测的工作)现在全都可以交由人工智能自动完成了。

根据Sight Machine公司的调查,在诸多领域中,汽车产业对该系统的需求。通用、丰田、日产等主要汽车制造商,再加上为这些制造商供给零件的企业,仅北美就有超过5000座与汽车相关的工厂。尤其是较为重视品质的工厂,不少都对Sight Machine公司的服务表示感兴趣。

除了上述的行业之外,已导入或有意向导入机器学习系统的行业还有很多,其中具市场潜力的当属电力行业的“智能电网”(电力管理系统)。通过机器学习来分析大量家庭、办公室、工厂等单位的电力消耗数据,实现对电力供给的实时管理,保证各个单位获得恰当的电力供给。

这类系统被称为“需求响应”,美国EnerNOC公司等已经开始将其商品化。2013年12月,日本丸红与EnerNOC设立合资公司,欲向法人顾客提供能源高效分配管理及咨询等服务。

机器学习还有一些别出心裁的应用方法,比如“安全保障”。举个例子,美国Palantir公司(本部位于加利福尼亚州帕洛阿尔托市)借助机器学习分析从邮件、电话、金融等多种信息源收集的大数据,向中央情报局(CIA)及联邦调查局(FBI)等美国政府机关提供有关恐怖分子与国际犯罪等方面的情报。

让“对冲基金兄弟”分出高下

机器学习还被应用于投资行业。关于这一点,在美国投资业的圈子里,运营对冲基金的尼德霍夫(Niederhoffer)兄弟的故事可谓无人不知无人不晓。哥哥维克多·尼德霍夫(Victor Niederhoffer)毕业机器学习还被应用于投资行业。关于这一点,在美国投资业的圈子里,运营对冲基金的尼德霍夫(Niederhoffer)兄弟的故事可谓无人不知无人不晓。哥哥维克多·尼德霍夫(Victor Niederhoffer)毕业于哈佛大学经济学系,毕业后经过几年的学者生活,1970年,他亲手创立了对冲基金。高明的投资手腕让他在业界崭露头角。

另一边,比维克多小20岁的弟弟罗伊·尼德霍夫(Roy Niederhoffer)自小就对做对冲基金经理声名大噪的哥哥敬佩有加,立志也要成为一名投资家。他升入哥哥的母校哈佛大学后,选择学习人工智能理论,然后以此为基础开发了一套将“市场情绪”(例如投资家的担心等)数值化后再进行机器学习的交易系统。利用这项技术,他于1993年设立了自己的对冲基金。

兄弟二人一路顺风顺水,不相伯仲,直到一件事的发生,让他们俩终于分出了高下。1997年10月27日,受当时亚洲金融危机影响,纽约证券市场股价一落千丈。曾凭借对市场趋向天才般的判断力而几度化险为夷的哥哥维克多在1997年那次股价暴跌时没能正确预估市场的走向,导致他遭受巨额损失,一手创立的对冲基金也宣告破产。

相对地,弟弟罗伊的机器学习系统在事前发出了警告:“市场有暴跌的征兆!股票和美国债券能卖的全都要卖掉!”弟弟听从警告抛出股票与债券,在暴跌前千钧一发之际幸免于难。

不过,当时维克多虽然已经破产,其弟弟罗伊却表示:“我哥不会就这样认输,他肯定会东山再起。”正如罗伊所言,维克多利用所剩无几的个人资产,于1998年再次设立自己的对冲基金。凭借一如既往的犀利交易手腕,它的可运用资产快速扩大,让全世界看到了天才尼德霍夫的复活。

然而悲剧再一次降临到维克多身上。亚洲金融危机之后10年,即2007年,世界交易市场因美国次级贷款问题再度崩盘。维克多这次也估错了市场的走向,导致可运用资产额度损失超过75%,好不容易复活的对冲基金再度破产。

另一边,弟弟罗伊再一次被他那套基于机器学习的交易系统救了下来。在次贷危机到雷曼事件的2007~2008年,他运营的对冲基金依然为大幅正收益回报,这使得他与投资家之间建立了牢不可破的信任关系。防爆云平台(www.ex12580.com)

对用机器学习交易系统感兴趣的人可以看看《利用机器学习开发算法交易系统》。

深度学习的冲击

从前文可以看到,机器学习正渗透至现代社会的方方面面,并为我们带来了巨大商机。文章开头提到目光敏锐的斯坦福大学学生对机器学习的课程情有独钟,其原因也在于此。

在诸多机器学习技术中,他们为关心的是深度学习。这项技术是神经网络(以人工手段还原构成人脑的神经回路网)的一种,所以深度学习又被称为“深度神经网络”(DNN)。它由一系列基于大脑视觉区的识别机制的算法实现。

深度学习让已经停滞了数年的图像识别、语音识别等模式识别技术(计算机、智能手机、机器人等机器自动识别图像、语音等模式的技术)产生了飞跃式发展。

举个Google的例子。2012年,Google与斯坦福大学的吴恩达副教授使用深度学习技术联手构建了包含16 000个计算机处理器的大规模神经网络。这个被称为“谷歌大脑”的巨大系统以YouTube上大量的视频资源(准确地说是静止的视频截图)为教科书,自主学习“猫脸”“人脸”等视觉概念(整体轮廓以及眼、耳、鼻等具体特征)。之后,这个系统根据学习成果在计算机屏幕上完成了原创绘图,画出了这些形象。

计算机不借助人的指导,完全自主地获取了某种概念,这一新闻带来了巨大冲击,眨眼间便传遍全球。深度学习有很强的通用性,所以很快就从图像识别领域发展到了语音识别领域。据Google相关人士透露,在导入了深度学习的新版本安卓(Google提供的手机OS)上,语音识别精度比前一版本提高了25%~50%。

Facebook也利用深度学习提升了图片的识别精度,以应对每天用户上传的数以亿计的照片。不仅如此,Facebook的图像识别还进化到了能识别照片详细内容,即理解照片中人物正在做什么的地步。Facebook人工智能实验室的燕乐存主任表示,Facebook正使用这一技术开发一种虚拟助手软件。比如用户向Facebook上传“深夜派对裸舞发酒疯”的照片时,虚拟助手会发出“确认要发布这张照片吗?发了可别后悔”之类的警告。

此外,Microsoft的基础研究所微软研究院也利用深度学习开发了实时的图像识别系统。这个系统能够迅速解析照相机拍下的照片,识别能力也进一步提升,从仅能识别出“猫”“狗”等大类进化到也可以识别出“罗得西亚脊背犬”“大麦町犬”等具体犬种。

Microsoft还将深度学习有效运用到了语音识别领域。该公司常年致力于机器翻译(使用计算机翻译外语的技术),但机器翻译长期以来采用的高斯混合模型性能有限。以基于深度学习的语音识别技术代替高斯混合模型之后,机器翻译的精度获得大幅提升。

2014年12月,Microsoft将上述机器翻译功能加入其开发的网络通话及会议服务Skype。如此一来,当用户通过Skype进行国际视频会议等交流时,能够享受到英语与西班牙语之间的自动同步翻译。设计当初只加入了这两门语言,是为了先观察一下用户的反应,再根据实际情况扩大对象语言范畴。

结合上述几个例子,我还要讲一个特别的现象,那就是深度学习的“可伸缩性”。所谓可伸缩性,是指随着输入数据量的增加,系统性能能够保持近乎正比例的提升。以往的模式识别技术中,数据量超过某一个值之后,系统性能就会见顶,但深度学习不会出现这个问题。也就是说,系统消化的语音、图像等数据越多,识别精度也就越高,不存在天花板。

图像识别、语音识别、自然语言处理

专家们普遍认为,在接下来几年,因深度学习技术而获得飞速发展的领域,将会是自然语言处理。自然语言处理是让计算机、机器人等机器理解我们人类交流时所用语言的技术。(前面讲的语音识别和自然语言处理技术比较容易混淆。简单说来,语音识别技术是识别我们发出的声音并将其转换为文字,而自然语言处理技术则是让计算机、机器人理解已经识别好的语言或文章的意义。)

Google和Facebook对这一领域尤为关注。因为如果计算机能够正确理解海量用户搜索时以及在网站上发布信息时所用的语言,就能以更高的精度发送定向广告(不同于一般的大片撒网式广告,这种网络广告仅流向特定用户群)。可以说,这项技术关系到两家公司网络业务的生命线。有专家称,如果Google或Facebook能够通过深度学习实现高精度的网络广告投放,仅此一项就能带来每年数百亿美元的利润增长。

另外,Google还在研究如何将深度学习应用于机器翻译的语言解析。业内认为,一旦这项研究取得成果,不仅像英语与日语这种语系完全不同的两种语言之间可以进行高精度机器翻译,还能使某种程度上的意译成为可能。加拿大蒙特利尔大学等一系列机构也在从事这项研究。

除上述自然语言处理外,深度学习还将为机器人产业带来革命。比如人工智能和机器人工学两个领域,广受世界关注的吴恩达副教授于2014年在美国举办的国际会议上表示:“若想让当代的机器人进化至下一阶段,我需要将剩下的所有时间都投入到深度学习的研究中去。”

与上述产业冲击同样,或者说更应该关注的是,深度学习在科学方面的可能性。简而言之就是,深度学习如今还有许多未解之谜,所以今后还有足够空间取得惊人的进化。

奇妙的神经网络

这里讲一个实际的例子。Microsoft的技术人员在开发基于深度学习的机器翻译技术时,曾让神经网络(深度学习系统)集中学习了几种语言。

初让神经网络学习的是英语和汉语。学习后,神经网络的英语能力和汉语能力理所当然地得到了提升。随后他们又让神经网络学习了西班牙语,于是西班牙语能力也得到了提升。然而神奇的是,学习西班牙语之后,该系统英语和汉语的语言能力也变强了。也就是说,系统在学习新语言时,也提升了原本学习过的语言能力。其中的缘由连系统的开发者都说不清楚。

包括上述现象在内,深度学习的内部机制还有很多连专家都搞不明白的地方。当然,像稀疏编码(详细内容将在后文说明)等技术,由于是研究者(人类)根据脑科学成果开发而来的,其中并不存在未知部分。但信息在繁乱复杂的人工神经回路网中如何传递,深度学习能够导出怎样的学习成果,这些问题还尚未完全搞清楚。

不过,这些谜题也是动力的源泉。毕竟当我们人类完全理解某个对象时,那个对象的极限也就摆在我们面前了。反过来说,像深度学习这种存在大量未知部分的技术,反而有可能实现人类预想之外的成长。

——本文内容节选自《人工智能的冲击》《Python深度学习》

我来说两句
人参与 丨 评论0条)
图标
注册 登录    
评论列表
每页 10 条,共 0 条

品牌商品

营业执照 | 增值电信业务经营许可证 | 豫公网安备41130202000490号 | 豫ICP备19015714号-1 (版权所有 防爆云平台 © Copyright 2009 - 2022 . All Rights Reserved.)