Uncategorized

“自由的探矿者”和“稳定的铜矿工”

这一讲我想给你破解一个迷:为什么中国的基础创新能力不行。咱们先来看两个场景。

第一个场景是,现在有一片巨大的矿区,其中大部分矿藏都是普通的铁矿,有些是铜矿,还有少量金矿,甚至还有一些宝石。你要在这个矿区里挖矿,挖到什么都会得到相当于矿石本身价值的回报。挖什么、在哪里挖都由你自己判断决定。你以个人身份面对不确定性:运气好可能会挖到宝石一夜暴富,运气不好可能连续好多天什么都挖不到。我们把这种情形称之为“自由的探矿者”。

第二个场景,我们称之为“稳定的铜矿工”。另有一片矿区,其中只有铜矿,但是储量特别大。有个机构愿意按照公平的、甚至可以说是相当高的价格收购铜矿石。你只要每天去挖一些铜矿石回来卖掉,就能获取一份不错的收入。

咱们假设按照人均而言,两者的收入差不多。那么请问,你是更想当一个自由的探矿者,还是稳定的铜矿工呢?

做个铜矿工当然就没有了暴富的希望,但是收入稳定,未来可控,不用整天担心朝不保夕,特别适合养家糊口。鉴于我经常听人说“不图大富大贵,只要平安就好”这种人生观,我相信大多数人的选择是去做一个稳定的铜矿工。

这个选择无可厚非。从投资理财的角度来说,如果均值一样,你应该选波动性小的那个 [1]。

可是如果我们换一个更高的视角,想象你是那个收购矿石的机构,答案可就不一样了。你可能会希望什么样的矿石都能有一些,最好还能得到一些罕见的宝石。那为了收获惊喜,你就得让系统有不确定性。你会更喜欢自由的探矿者这样的制度。

我要说的就是,“自由的探矿者”是正确的科研制度,而“稳定的铜矿工”是中国的科研制度。

*

我最近回国接到一个作报告的任务,到一个研究所去讲“以人工智能为例,谈谈科技创新的对外依存与自主可控”。正好我有个同学是国内某著名大学的人工智能和机器学习方面的教授,我就采访了他。

我同学他们现在使用的技术完全是国际最新水平,不过他还是很佩服美国同行。这个领域最原始的想法都是美国人想出来的,而且直到现在也是美国人的想法更丰富。中国科学家的跟随能力很强,也可以在某个方向上超越美国同行,但是原创性的发现能力还是不行。那为什么不行呢?我同学认为问题在于在国内搞科研不自由。

你可能会觉得有点奇怪,人工智能是个纯技术领域,又没有什么学术禁忌,有啥不自由的呢?我同学说的确是你想研究什么都可以,但是在实际上,因为有发表论文的要求和短期项目的诱惑,国内科学家其实并不容易去自由地探索一些不一定能出成果、却有可能带来惊喜的方向。

*

带着这个问题,我又重读了一遍我们专栏以前提到过的一本书 [2],人工智能的神经网络方法的祖师爷之一,特伦斯·谢诺夫斯基写的《深度学习》。这本书回顾了使用神经网络和深度学习算法实现人工智能的科技发展史。我先给你用最简单的语言讲一遍这个故事。

最早的时候,人们设想人工智能是一套基于规则的专家系统。你先把一系列规则都给说明白了,然后拿一个东西来,看它是否符合规则。这个做法已经都能用来证明数学定理,但是却不能用来做计算机的图形识别。

人们对计算机视觉的难度估计过低。1960 年代美国军方给了麻省理工学院一笔钱,要求他们研发一个会打乒乓球的机器人。大家都觉得这应该很简单,居然把这个任务交给了一个本科生……结果做起来才发现这件事情有多难。你连怎样让计算机从一张照片中找到乒乓球都不知道。

但是早在 1950 年代,就已经有一些人想到,能不能通过模拟人脑来解决计算机视觉问题呢?人脑识别一个什么东西根本就不是基于什么明确的规则,我们都是直觉判断,是特征匹配。这就是“神经网络算法”的最初思想。有人发明了“感知器” —— 神经网络的前身 —— 用于给图形分类,然后又有数学家在 1957 年证明了“感知器收敛定理”。不过这些思想都属于非主流,感知器有些根本性的困难,被认为没有前途。

1980 年代,谢诺夫斯基本人曾经到麻省理工学院做了一个报告,他说当下最强的计算机比苍蝇的大脑要复杂得多,那为什么苍蝇能够在飞行过程中很好地识别各种物体、避免撞上,而计算机做不到呢?因为大脑的神经网络系统是固定的,是演化的产物,而计算机系统是通用的。这一派的想法是设定一些虚拟的神经元,形成一个网络,就好像大脑一样,然后根据具体的问题对神经网络进行训练。

这有点仿生学的意思。其实谢诺夫斯基本来是个生物学家,他曾经是哈佛大学医学院的神经生物学博士后。他完全凭兴趣写了一篇有关用计算机实现神经网络的小论文,然后就被邀请和搞人工智能的科学家们开会交流,属于是跨界。

而这个跨界思想一直到八十年代都是被主流打压的对象,拿经费、发论文都很困难。不过当时主流学界也没有更好的办法,人们普遍认为人工智能的寒冬到来了。彼消此涨,非主流渐渐有了发展空间。

包括一位最著名生物学家、DNA双螺旋的发现者之一,弗朗西斯·克里克,也参与进来。人们甚至借鉴了像无脊椎动物的脑神经系统这种非常专业的生物学知识,把生物视觉和计算机视觉放在一起研究。就这样,计算机科学家、生物学家和数学家合作,奠定了现代神经网络的理论基础。

而这个思想不但解决了计算机视觉问题,而且被用于语音识别、机器翻译、医学诊断众多领域,包括 AlphaGo,也是这个思想的产物。

*

我们可以从这段历史中总结三个特点。

第一,学者搞研究是为了解决问题,而不是为了发表论文。

第二,现在如日中天的思想,刚出来的时候在领域内属于非主流。用谢诺夫斯基的原话来说,这是一个“一小群人在对抗建制派”的故事。

第三,成功来自计算机科学家、生物学家、脑科学家、和数学家的跨学科合作,而这个合作完全是自发的。

这是一个开始于上世纪五十年代美国的故事。那我们今天的中国,能不能发生这样的故事呢?我认为比较难。咱们回到开头的挖矿模型。

*

科学家应该是自由的探矿者。

第一,什么是为了解决问题而研究?就是主动探测稀有的矿石和宝石。科学家的首要追求并不是钱,而是声望。你的发现越重大、越稀有,它带给你的声望就越大。当然钱也很重要,而且政府、包括军方,是主要的矿石收购者。

不过政府应该按照矿石的实际价值收购。宝石必须比铜贵很多,人们才会愿意去寻找宝石。

第二,为什么会有人探索非主流的方向?因为人少的地方有可能有没被发现的宝石。一大群人都在那个地区探测,一开始你也跟着去了。后来你发现那里好像没有什么好东西了,你自然就会想去别的地方。对探矿来说,独立思考真的是有好处的,而不仅仅是一句口号。

第三,为什么会有跨学科的合作?挖矿这件事完全是自由人的自由联合。可能我的力气大,你有好的出货渠道,他善于探测,那我们三个人就应该联合起来去做这件事。如果我们团队还差一个挖矿工具,我们自然就会再去找一个手里有好工具的人。各路人马觉察到这片土地有好东西,自然就会都跑过来参与。

所以这个人工智能的故事没有任何奇特之处,这就是科学发现的典型故事。那为啥中国就没有这样的故事呢?因为中国实行的是“稳定的铜矿工”制度。

*

一方面是因为我们过分追求“公平、公正”的量化管理,一方面是因为我们的学术水平低,中国收购矿石的机构,并不怎么在意你拿出来的是铜矿石还是宝石。中国科研体系不在乎实际问题,中国只认论文。

你研究十年,给领域提出一个新方向,未来也许影响深远,发表在了重要的期刊上。别人花很多钱买了五台冷冻电镜,批量测定各种蛋白质分子结构,因为引用率高,能发一大堆顶级期刊论文。中国的评价体系只看论文发在哪、不看研究的实际价值,所以你的宝石最多只能得到跟铜矿石一样的收购价。

挖铜矿石是容易的。铜矿代表主流,铜矿代表跟风,铜矿就在那里。你只要勤奋就行,你不需要运气,你甚至都不需要聪明。“上帝喜欢笨人”,你对记者说。

有稳定的铜矿谁还去挖不知在哪的宝石啊?

以前有些中国科学家抱怨中国的科研制度,现在这种声音已经很少了。以我之见,中国科研制度虽然对*科学发现*、对*国家*都没好处,但是对*科研人员*很有好处。这个制度给了科研人员稳定的收入和比较高的地位,把他们养得很愉快。这个制度还非常可控,完全不必担心学者们做出你不喜欢的事情。

当然,我们偶尔会想,为啥改革开放四十年,中国都没出一项诺贝尔奖级别的工作……但是,我们的内心深处是满意的,只要铜矿的收购价足够高就行。

*

我还发现,以自由的探矿者开始的事业,总会向稳定的铜矿工方向演化。

现在美国的科研体系正在变得“中国化”。过去几十年美国的科研经费指数增长,可是并没有得到相匹配的科研成果。科研工作者们越来越以发论文拿经费为目标,评价方法越来越量化。具有跨学科眼光的“通才”型人物所占比例很少,工匠式学者的生存空间越来越大。

而这个道理是容易理解的:哪怕是一群强盗,只要占山为王,也会追求稳定。稳稳当当地把科研经费接下来,完成任务,实现可持续发展,这是人的本能。

但是这个日子其实是不可持续的。主流终将面对困局,世界上没有取之不尽而又永不降价的铜矿山。我们只是不知道困局何时到来。

自由和稳定互相矛盾,声望和位置是两种追求,创新在本质上不可控。真正的科学家和创业者都是反叛者。意识不到这一点,谈论“创新”就是叶公好龙。

留下评论