观点一:不要被数据所困
微软亚洲研究院副院长陈铁岩博士讲到,深度学习现在应用得相对成功,是因为深度学习有非常强的函数拟合能力,需要有大量的训练数据。但另一方面,一些现象、一些大量数据产生的背后常常是简单的规律驱动的,比如物理的牛顿定律、宏观经济的数量方程等等,都是一两个简单公式就完成了计算。这就启示我们,如果找到大量数据产生背后的规律,那么只需要少量样本数据,也能计算出正确率较高的结论。
陈铁岩也讲到,他自己及其团队在日常的研究中经常使用的算法,需要消耗上亿量级的训练数据,但是自己对于人工智能和大量的训练数据之间是否存在必然联系还存在一些疑问。因此,他建议大家,不一定要盲目地使用大数据,而要思考,如果不用大数据,而用思辨的方法、萃取的方法,是否能利用少量有效的数据就能达到同样的目的。
“不要被数据所困,要寻找新的突破点。”他说。
观点二:大数据仍是AI的基础
华东师范大学教授钱卫宁从学界的角度观察认为,深度学习是非常好的技术,发展也很快,但是深度学习并不等同于人工智能。人脑科学的发展也很快,但现在脑科学和人工智能研究之间的联系还是非常弱的。谷歌的“阿尔法狗”掀起全球对人工智能的热潮,然而“阿尔法狗”的应用有很多特定的前提和条件:规则是确定的(围棋),算法是确定的(围棋),数据是确定的(围棋经验),而事实上,现实生活中的人工智能应用,这些又都是有很大的不确定性的。
“各行各业都可以去定义我们自己的人工智能应用,但是并不是每一个应用都可以像围棋那样来清晰定义问题,清晰获得数据,清晰定义输赢,这是我们所面临真正的挑战。这个里面的问题大多数是数据的问题,不仅仅是人工智能的问题。我们在很多的应用里面已经有了数据,可以以非常小的成本获得这些数据,我们为什么不去用它?本身大数据是一个资源,而不是说讨论大数据用还是不用的问题,而是我们已经有这些数据,或者我们获得了这些数据之后怎么样更好的利用它。现实的中,大数据仍然是人工智能应用的基础。” 钱卫宁说。
“在未来比较长的时间里,大数据还是人工智能应用的基础。”滴滴出行高级副总裁章文嵩从产业界角度解释数据在实际应用中的地位:不可取代。他表示,无论是模型还是算法,对技术人员来说都比较容易掌握,唯有数据是不可替代的,数据才是真正有价值的部分。从滴滴出行的应用场景来分析,目前深度学习在拟合函数时,当参数规模达到百亿甚至是千亿时,产生巨大的计算能力,就可以解决各式各样的问题。只要有足够大的计算能力、足够大的规模网络。
中科院计算所研究员陈熙霖博士表示,人工智能之所以在今天有了大发展,是因为大数据、算法和硬件平台三驾马车在同时作用,缺一不可。过去几十年,人工智能发展不快,或是因为数据量不够,或是因为计算能力不够强。人工智能的算法起着非常重要的作用,计算能力则是起到乘数的作用,数据也非常重要。大规模的训练数据帮助人工智能从实验室里走出来,走向应用。“离开了分析的大数据,算法就是垃圾.
上一篇: 云锋虞锋:用哲学的思考做选择
下一篇: 不锈钢到底是什么样的钢?
违法和不良信息举报投诉电话:0377-62377728 举报邮箱:fbypt@ex12580.com