第253章 AI革命(2 / 4)

面做了一些实验,发现通过对偶学习的过程,章杉只需要用10标注的数据(大概100万英法双语句对),再加上很多没有标注的数据,达到用100标注数据(1200万英法双语句对)训练的模型的准确度。

一千万个训练语料标注的费用差不多2200万美元,如果章杉能把标注的人工费用从2200万美元降到200万美元,这会是一个非常好的结果,能够大大降低公司运营成本提高运营效率。

很多问题以前是因为受限于没有标注的数据,没有办法用深度学习技术。

现在章杉能够从无标注的数据进行学习,那么很多应用很多问题里面都可以应用深度学习技术。

论文到这里已经很牛了!

但仅仅如此吗~

章杉继续读完,很快就震惊了!

因为论文里似乎提出了一种崭新的概念。

现在虽然深度学习很受欢迎,但是说到底深度学习主要是从大数据进行学习,就是通过很多标注的数据,使用深度学习算法学习得到一些模型。

虽然叫着人工智能的名字。

但是这种学习方式和人的智能是非常不一样的。

人是从小样本进行学习。

人对图像进行分类,只需要很少几个样本就可以做到准确分类。

两三岁小孩,开始认识世界的时候,他如果想知道什么样的动物是狗,我们给他看几张狗的图片,并且告诉他狗有什么特征,和其他动物像猫或者羊有什么区别的话,小孩可以很快很准确的识别狗。

但是像深度残差神经网络,一般来说一个类别大概需要上千张图片才能进行比较充分的训练,得到比较准确的结果。

再比如汽车驾驶,一般来说,通过在驾校的培训,也就是几十个小时的学习,几百公里的练习,大多数人就可以开车上路了。

但是像现在的无人车可能已经行驶了上百万公里,还是达不到人的全自动驾驶的水平。

原因在于,人经过有限的训练,结合规则和知识能够应付各种复杂的路况,但是当前的ai还没有逻辑思考、联想和推理的能力,必须靠大数据来覆盖各种可能的路况,但是各种可能的路况几乎是无穷的。

随着一项项能力的提升,章杉现在对人的理解也很深。

人的智能包含了很多方面,最基本的阶段是认知性智能,也就是对整个世界的认知。

尽管现在对于图象识别、语音识别,ai已经差不多能达到人类的水平,当然可能是在某些特定的约束条件下,能够达到人类的水平。

但是其实这种认知性的任务,对人类而言都是非常简单的,现在ai所能做的这种事情或者能达到的水平,人其实也很容易做到。

只是ai可能在速度上更快,并且规模上去之后成本更低,并且24小时都不需要休息。更有挑战的问题是,人工智能能不能做一些人类做不了或者是很难做好的事情。

像图象识别、语音识别这类认知性的任务,ai之所以做得好,是因为这些任务是静态的,所谓静态就是给定输入,预测结果不会随着时间改变。

但是决策性问题,往往和环境有很复杂的交互,在某些场景里面,如何做最优决策,这些最优决策往往是动态的,会随着时间改变。

现在有人尝试把ai用到金融市场,例如如何用ai技术来分析股票,预测股票涨跌,对股票交易给出建议,甚至是代替人来进行股票交易,这类问题就是动态决策性问题。

决策性问题的第二个难点在于各种因素相互影响,牵一发而动全身。

一支股票的涨跌会对其他股票产生影响,一个人的投资决策,特别是大的机构的投资决策,可能会对整个市场产生影响,这就和静态的认知性任务不一样的。