【文摘】阿尔法Zero、知识树与生命树

影视ai

很多影视作品都展示了机器人自由意志的觉醒,以及随之产生的伦理难题

阿尔法Zero、知识树与生命树

文:杨鹏  启与示

 

阿尔法Zero震惊世界!

10月19日,“畅所欲言”群,张树新发出《今日Nature:人工智能从0-1,无师自通完爆阿尔法狗100:0》文,同时感言:

“今天凌晨(10月19日),谷歌Deepmind发布重磅论文《Mastering the game of go without human knowledge》,阿尔法Zero在围棋知识和经验零输入的前提下,通过自我学习、强化学习,在极短时间达到超人水平。3小时阿尔法Zero在乱下;36小时超越李世石版;55小时发现非人类定式;72小时出关。仿佛在读科幻小说!”

我深受震撼,感到这是大事,马上将此文及张树新感言转发。现将我在不同群里看到的一些评论汇聚分享(以“重新理解中国历史”、“启与示”群观点为多)如下,我个人看法在其中。

陈政:今天一早,就被你转文中的AlphaGo Zero震撼,有空就在琢磨。这是个巨大突破。

围棋ai

在每场对弈结束后,阿尔法zero就生出一个新的神经网络。——阿尔法项目首席执行官德米斯哈比斯

陆雄兵:人类的经验被清零了,所以,人类一思考,上帝就发笑。

王维嘉:这种不依赖人和数据的强化学习必须有明确规则。新阿尔法零和阿尔法狗72小时下了490万盘棋。人类由于从残局学起,很可能在群山中一个小山包附近转悠了两千年。机器对弈不受这局限,像飞毛腿几天就浏览过所有大山很快找到主峰,鸟瞰人类两千年打转的小山包。机器对弈等于机器自己产生数据,所以这次结果只对有明确规则的情形有效,在其他认知场景不一定有效。


陈政:AlphaGo Zero令人震撼。只有规则,并不需要所谓人类智慧的输入(作者注:中国传统棋艺被赋予了很多玄学和美学色彩,参见对吴清源等围棋传奇人物的文字描写),AlphaGo Zero对于学习人类的思考方式和成果不屑一顾,而是创造出自己的、人类经验触及不到的新的定式;反过来,人类并不能直观了解它的思维方式。一种新的不对称诞生了。纯粹的“机器智能”开始有了实例。

张树新:围棋是完全信息游戏,只需要规则。阿尔法自己对弈生成数据,然后从数据中学习提高。说起来像是武当轻功梯云纵左脚踩右脚,但人也是这样来的,就是效率相比太低。围棋就是道数学题,阿尔法基本解开了。事实证明,人类经验不是最优解,人类只需属于人类自己的经验。在人工智能这个问题上,也许人类更看重“什么是我的”而非“什么是好的”。

纽约客

《纽约客》最新一期封面

杨鹏:从哲学意义上,人类经验,人类传统的价值归零,一切可以从算法新起步。上帝是数学家,柏拉图的哲人王出现了,就是算法王?数学为王的时代降临?我们不得不重新研读数学?

沐春:AI 的逻辑运算速度和存储(记忆)功能可以是人的亿倍,凡是有规则的游戏或者活动,人只有甘拜下风,这没有什么奇怪的。人类的棋谱也是多年下出来的,AI只不过把这个实践过程压缩在一两天罢了。AI因为计算速度和存储容量的巨大,根本不是人脑这种要抽象和分类的逻辑架构。所以未来不仅西医,就像中医这类经验行业,在无数行医者上传的海量数据处理后,AI云医会比人医水平更高。看整个宇宙的进化史,从简单的化学反应到复杂的生物过程,都是算法。宇宙从单一物质向丰富物质的演进过程,就是不断构造和连接的过程,也是算法不断升级的过程。什么诗创作,油画创作,甚至感情,如果精细解构的话,都是算法。我们的五脏六腑和气血运行,都是不同的算法。

王杰:现在没有哲人王给普罗大众阐释这件事的意义,对AI的阐释工作交给好莱坞了,而且比较悲观的,好莱坞对未来的阐释很可能成为现实。我们对人的“智能”本身了解得还不够多,这会儿又出现了一个人工(智能)的“智能”,而且很快在许多领域超越人的智能。人的智能,像个多功能瑞士军刀,当每个单项功能逐步被人工智能取代之时,就是人类整体被人工智能取代之日。我们谈及“智能”,要回到亚里斯多德,他把“智能”定义为一种行动能力,一种能达到正确目的的行动能力。按这个定义,不需要经验、试错就可以直抵目标的,就是神级的大能大智。经过无数经验试错仍无法达到正确目的,是愚蠢至极。人类智能处于中间位置,上面是神级智能,下面是随机漫步的无智存在物。机器智能拥有越来越强大的计算能力,能打通随机漫步到神级智能之间的通道。

黑客帝国

《黑客帝国》描述的未来文明形态:算法取代人类伦理

GT:按Bible的说法,人吃了智慧果,有了智慧。差的就是个长生果。长生果没让人吃,就赶出去了。人的智慧可能是无止境了,但生命还是有止境的。

王杰:“创世纪”里面最重要的冲突,就是智慧树与生命树之间的隐喻了。智慧树上的果子吃了以后,吃到今天这个阶段,才会破除生命之魅。

杨鹏:犹太拉比Arthur Green认为,夏娃、亚当在伊甸园中犯下的罪,是因为蛇引诱夏娃先吃了智慧树上的果子,而不是先选择先吃生命树上的果子,所以造成了人容易先知识后生命,本末倒置。

王杰:现在仍有一小撮不知悔改的西方知识分子,拼命地吃知识树上的果子,妄图通过人机结合的方式达到长生不老。如谷歌技术总监库兹韦尔,整天吃100多种药,坚信有生之年一定会做到人机结合。

醒来

始终伴随人类文明的知识野心——长生不死

旭梅:从设计思路看,阿尔法零AlphaGo Zero的思路是生命树的思路,是让AlphaGo Zero从零开始,通过下棋、试错,自己创造新的知识。据DeepMind团队创始人David Silver介绍,Zero的“陪练”都被校准为与它持平的水平,它的“陪练”从非常基础的水平开始,逐渐上升为非常高的水平。这是生命树思想,是新生命自己发展出新知识的思想。这里的知识是生命为适应限制情景所创造或发现出来的。

而阿尔法狗的设计思想,是知识树思路。让阿尔法狗去学习人类已有的棋谱,运用人类的旧知识。人机竞争是在同一系统下的竞争。阿尔法狗的优势在于克服了人类的弱点,占有比个人棋谱数据量更大的棋谱,没有情绪波动,不受体能影响,运算速度更快,因此出错较少。这是死知识的活运用,是新生命服从旧知识旧经验。

杨鹏:人类文明建立在经验和知识积累的基础上,AlphaGo Zero似乎预示着,人类未来文明与传统文明可以完全断裂,人类可以不依赖过去,可以一切从零出发,一切从新算法出发,另开新路。这也意味着,生命与知识之间,让探索新知识的生命的生长,比掌握旧知识更符合生命的本质,更符合上帝的想法。中国教育的重点放在了知识的掌握上,得完全重构为生命树的生长创造运用知识的教育。

文明源

如果数据文明源自造物主的意志而非人的意志,那么人类算什么?

旭梅:中国的教育是被孔夫子规定下来的,孔夫子办私学教的是距他500年前的周公传下的旧知识,企图用旧知识逆向塑造出他理想中的人来,用这些理想的人建立起他的理想社会。起点就是知识树,这样的教育结果必然走向死亡。老子的哲学是生命的哲学,教育的核心在于顺应生命创生的自然,新生命需要新知识,新知识由新生命创生,知识服务于创生。“生”来源于“一”,来源于创生之“道”,来源于创造之“上帝”,不是来源于人。

杨鹏:上帝在伊甸园中安排有知识树与生命树,看人的选择,这隐喻有意思。人已吃知识树上的果子,了解旧知识是本能,看来信仰才是生命树。算法为王时代,回顾历史,有一个重要信息:算法的祖宗,数理的祖宗,毕达哥拉斯、柏拉图、欧几里德等人都认为:数是上帝之言,是上帝支配时空之法。数通往上帝,人通过数接近上帝。他们知道,数之上还有上帝,数的秩序服务于生命这个目的。



此条目发表在人工智能, 圣经, 格物, 计算机安全分类目录,贴了, , , , 标签。将固定链接加入收藏夹。