然语言算法逻辑是基于我自己设计的一套‘重复度’评分的,也就是说,它会优先选取网络上已经存在的答案,并进行一定的排列组合。”
“而校准过程,则是不断进行数据库对比,筛选出评分更高的答案-——评分的标准,是答案与互联网信息的重复度。”
“懂了,引入reward模型的有限监督训练。”
陈念一瞬间便领悟了王建成的逻辑。
不得不说,这是在算力有限的情况下一种很聪明的解决方案,借助这种方案,一个人工智能可以在处理简单问题时表现得极为聪明。
因为实际上,它就像是一个远程遥控聊天装置,藏在背后的并不是0和1的代码,而是庞大的真人数据库。
陈念还记得,当年人工智能概念刚刚兴起的时候,国内就有过这样思路的所谓“AI”,但他对这类AI始终嗤之以鼻,因为方向走错了。
这种东西存在的意义,纯粹就是骗经费和补贴而已。
想到这里,陈念开口说道:
“你这东西想法很好,但路线完全走错了。”
“我不能支持你继续按这个方向走下去,因为你走得越远,对真正的AI技术发展的伤害就越大。”
“为啥?”
王建成不解地问道。
“因为它不是真正的AI,它只是一个聪明的搜索引擎。”
“聪明的搜索引擎明白了。”
王建成并不蠢,在听到陈念的解释之后,他立刻就想明白了问题的关键,也领悟到了所谓“走得越远伤害越大”的意义。
于是,他赶紧继续问道:
“那如果我改变方向呢?是不是整个逻辑都要重新设计?”
“那当然是要重新设计的.而且,这个白泽,其中最有用的部分,估计是你之前投入精力最小的部分,也就是它的自然语言模块,尤其是它的reward模型。”
“如果你不能解决reward模型的问题,AI的进化就要永远停留在人工监督的阈值之内,造出来的,也只能是假的AI。”
“明白了。”
王建成长长舒了一口气,从他的表情来看,似乎是已经下定了从头开始的决心。
陈念突然觉得,这小子做的事情总有些说不出的喜感。
他心心念念地想着要搞空中平台,要搞空天母舰,但好像,绕来绕去,他最擅长的,还是人工智能
也不知道,再过十几年,他到底是会成为南天门之父,还是人工智能之父?
也许,两者都是?
想到这里,陈念不由得期待起来
(本章完)