博士毕业了,趁着博客正式开张之际总结一下,顺便帮助那些不了解我的人——包括许多因为认识我一些年而误以为了解我的人——了解我。为这事费点笔墨是值得的,毕竟我的思想背景在中文世界远非主流,因此许多人持有的“因为你人生的某一阶段和我相似所以我们应该是一类人”的朴素观念常常让我感到困扰。

学业

化学反应是分子的反应,分子无时无刻不在振动,所以分子的振动理所应当地影响着反应过程。问题是,具体怎么影响的?能用方程写出来吗?

这就是我博士论文的大致领域了。我做的工作可以分为两部分。一是为导师数年前推导的一个化学动力学方程找到了一种无需经验参数的参数化方法。之前他那个方程只能根据实验数据猜下参数,实用性很差,而现在我们可以完全利用量子化学软件算出来的数据进行参数化了,计算出的反应速率在一组经典实验上和实验结果以及其他理论模型 (Marcus theory) 计算得到的结果都吻合的不错,算是初步校准了吧。

理论和实验数据的对比。除了比较特殊的分子 M 之外,我们的理论速率和实验结果基本都在一个数量级上。

二是——也是更有意义的一个结果——和之前的大部分模型比起来,我们的方法可以直接分析分子振动对动力学的影响。经典物理里我们已经知道分子的振动可以分解为正则振动 (normal mode)。一个反应当然所有的正则振动都会参与,但参与程度有多有少,我们的模型似乎能够依次找出最重要的那些振动方式(它们是正则振动的线性组合)。说“似乎”是因为这个方法是基于物理上的一些想法,我还没能得到一般性的数学证明。比如上图里的那些分子,它们的单分子三重态转移 (triplet-triplet transfer) 都由经典的实验研究过了。这些分子的原子数在 40-70 不等,所以正则模式都有一两百种,当我们把所有模式的参数都放进方程,那就是上一段所说的结果——和实验数据吻合。但我们还有办法找出一个“主模式”,仅仅把它放入方程就足以得出几乎一样的反应速率,也就是说这个主模式完全主宰了反应,这就是我的第一篇论文

两个有代表性的分子 c-1,4ee 和 d-2,6ae 三重态转移过程的主模式。

不难看出主模式在局部具有很高的对称性,进一步分析会得到一些对反应过程更深的理解,这就是第二篇论文。之后与一个实验组合作,把这方法应用到另一组很有趣的分子上去,一通分析后是正在写的第三篇论文

原则上这个模型适用于任何单分子反应,对理解诸如有机太阳能电池材料的性质、生化里的各种反应都可以有帮助。当然生活不会那么美好,确实已经遇到一些失败的情况,原因还在研究中……

总的来说在平均水平以上吧,算不上一流的研究,但在这学校也还可以敝帚自珍一下。如果你感兴趣,这是我的博士论文

主业

人类的语言能力出类拔萃,那问题来了,其他动物有语言吗?当然还是有的,只是比较原始。这个问题的第一个明确证据出现在黑长尾猴 (vervet monkey) 身上。科学家注意到这种猴子看到不同捕食者时似乎会发出不同的声音来警告同伴。它们有三种警报类型:看到老鹰的、蛇的和花豹的。不同的警报会触发不同的反应,比如听到蛇警报猴子们就会往树上跑,而听到鹰警报则会躲到树枝繁茂的地方。灵长类学家用录音机把不同的警报声录下来然后在没有捕食者的时候放给猴子听,发现依然会触发类似反应,这就确证了这些警报声音本身携带着捕食者的信息。我们先来听下它们都是啥样的。

  • 鹰警报
  • 蛇警报
  • 花豹警报

大部分人应该直接就能听出区别。它们的频谱也确实不一样。从频谱图上可以看出蛇警报高频成分很多,听着也确实比较尖锐,不信你再听一遍。

三幅图依次为鹰、蛇和花豹警报。横轴是时间,纵轴是频率,颜色的深浅就代表那个时刻的声音在某个频率上有多大的分量。中图明显在频域上更广。图片来源

这是区别比较明显的情况,要是遇上灵长类学家也莫衷一是该怎么办?我们能不能让电脑来当裁判?为了解决这问题,我在网上找了个关于黑长尾猴警报的视频,提出音轨,然后把相应的警报声剪出来让电脑分类。想法是这样的:电脑在分类时是不知道这些音频对应着什么警报的(用机器学习的黑话这叫非监督式学习),假如电脑分成三类得到的结果与灵长类学家的观察结果吻合,那就说明这方法是对头的。

我测试了三种分类算法:Gaussian mixture modelk-means 和 Partitioning Around Medoids (PAM),k-means 和 PAM 得到的结果都不错,至少有70%的数据被正确的归类了,下表显示了每类中有多少数据点。

k-means 类1 类2 类3
0 1 195
0 185 56
花豹 101 4 36
PAM 类1 类2 类3
185 11 0
32 209 0
花豹 20 13 108

这就说明这种音频处理方法是有效的,于是我们就可以转向监督式学习,即这次我们告诉电脑每个输入音频是什么警报,从而训练一个模型,这个模型就能够用来推测一个未知音频最可能是什么含义。我尝试了支持向量机决策树AdaBoost, 和高斯朴素贝叶斯方法。除了支持向量机之外的方法都得到了 >90% 的准确率。决策树和 AdaBoost 表现的最好,在精细调参后分别可以得到 97% 和 99% 的准确率(源代码和音频处理的技术细节见我的 GitHub)。想象一下,假如我们能把它做成一个 app,那灵长类学家在野外拿着手机录下一段声音后 app 就会告诉你这段声音最可能是什么警报,这不就是一个初级的动物语言翻译器了吗?

这套方法显然也可以用到其他动物身上,蛙叫鸟鸣都不成问题。考虑到世界上有那么多会发出声音的动物,简直前途无量,这么简单的方法不会之前都没人想到吧……于是我赶紧去检索了下文献,结果发现居然只有一篇类似的论文。但太类似了,类似到数据都用的是黑长尾猴。虽然只比我早不到一年,但我毕竟不是第一个了……唉,错过了开创一个四级学科的机会,只好等下次了●︿●

虽然没能开创一个新领域,不过这个例子很好地说明了我这些年的生活状态。了解我这边生活的人都知道我几乎不去学校,六年下来在实验室的日子应该不会超过一学期,大部分时间都是这样在家里东搞西搞。这些年大脑版本确实又升级了几次,但跟博士学习大概关系不大……读博的主要好处就是让我能有够用的工资和时间瞎折腾罢了。

2017/10/29 更新:最近发现对海豚和草原犬鼠 (prairie dog) 都有类似的研究,尤其是草原犬鼠,它们的警报系统复杂到能够描述入侵者的体型和颜色,颇为惊人。

职业

家长经常担心孩子玩物丧志影响学习。我小的时候他们担心看电视,现在大概是担心玩电脑和手机,但这种担忧有数据支持吗?为此我找来了国际学生能力评估计划 (PISA) 2012年的数据。PISA不仅测试了各国孩子的成绩,还统计了诸如家里有几辆车、几间厕所、几台电脑手机等等。多一台电脑在穷国和富国的含义可能截然不同,所以我按人均 GDP < $15000、$15000 - $30000、> $30000 分出低中高收入地区的数据,然后研究了一下相关性。假如学生成绩随着财富拥有量的增多而提高,就是正相关 (positive),反之负相关 (negative),否则不显著 (insignificant)。

不同颜色的线代表不同的人均 GDP 水平。第一幅图是关于手机的,第二幅是关于电脑的。可以看出二者在任何国家几乎都不与成绩负相关,尤其是电脑,几乎在哪都与成绩正相关。

点击下方地图或者在下拉列表里选择即可查看相应地区的数据

虽然这只是相关性,不是因果性,但在情况各异的那么多国家都呈现出如此强烈的相关性,至少先让我们对玩电脑丧志假说打上个问号吧。

这其实是我之前参加 Udacity 的 Data Analyst Nanodegree 时做的一个项目,完整版在这里。如 Google 首席经济学家范里安所说:

If you are looking for a career where your services will be in high demand, you should find something where you provide a scarce, complementary service to something that is getting ubiquitous and cheap. So what’s getting ubiquitous and cheap? Data. And what is complementary to data? Analysis.

数据分析确实是个会快速增长的行业,而且像这样从数据中寻找对世界的理解也非常的有意思。于是我就花了点时间学习了一下,最终顺利去了 Google。如果你也有这方面的打算,我的部分学习经历也许对你能有所帮助(顺便,这是我的 Udacity 300元优惠邀请链接)。

笑柄

他隐忍数十年,终于当上总统,任内借机废止了动勘,推动了议会和总统民选,和平实现了政党轮替,还成功测出对岸的色厉内荏,保小岛平安至今,台湾自由化的每一步几乎都有他的身影。他就是李登辉,华人世界少见的政治家。

从这段评价不难看出我的政治观点和大多数人很不一样。我完全理解此类观点在天朝的罕有和后果,并且完全乐意接受它。考虑到我一贯深思熟虑的风格,我不认为一般人有能力改变我,所以就不要来费这个劲了,很可能我们根本不属于一个道德共同体。就如辉格所说,我们这些人是注定要成为笑柄的,那就做一个热情的看客,或恬淡的笑柄吧~

在最简化的层次上,人类历史就两个阶段:工业革命前的马尔萨斯陷阱时期和之后的大分流 (Great Divergence)。这幅图有助于思考此类问题:人类在 99.9% 的时间里过着什么样的生活?现代文明是理所当然还是需要努力捍卫的?如果没有大英,今天的世界会是怎样?现代文明的中心在哪,边陲在哪,敌人在哪?有些人津津乐道的汉唐盛世、大国崛起在这幅图上处于什么位置?图片来源配套课程

二次元

这些年看了许多动漫,大部分都没什么意思,只够打发时间,但遇到《银魂》就让我觉得这些都是值得的。虽然最近的漫画有点让人无语,但以前的作品依然让我又哭又笑、被猩猩玩弄于股间仍欲罢不能(*/ω\*)

另外两部很喜欢的作品是《灌篮高手》和《星际牛仔》。

运动

在酱油队都快踢不上主力了 (;´༎ຶД༎ຶ`)

三分依然很准

有一搭没一搭地健身了n久

并卵

未来

时不时就会有人问我为什么不留在学术圈努力当教授——问这问题的人一般既不理解学术圈也不理解我。我的标准回答是水平不够,这是事实,但其实不是全部。真正的原因就像《纽约客》对张益唐的采访里说的,

追求终身教职,需要一个学者频繁地发表论文,这通常意味着将研究缩窄到某个特定领域,对此,张益唐没有兴趣。他似乎不想和其他数学家竞争,也不因数年来只是一名普通老师而不满,要知道和他同辈的数学家都是教授了。了解他的人中,没有人认为他适合做终身教授。

学者其实分为两种,弗里曼·戴森把他们称为鸟和青蛙,哈耶克则称之为“自己专业中的大师”和“困惑型”的人。重点并不在于鸟和青蛙谁厉害——青蛙可以很大只,鸟也可以像我这样还不太会飞;而是二者的学术兴趣和研究方法都很不相同。假如我一心扑在一个小领域上,应该也能在学术圈混口饭吃,但那样的生活对我来说太过无趣了。而如果我既想当鸟又想留在学术圈,难度又太大了。由于邓巴数的限制,一个子学科的一线研究者数量约在150左右,其中鸟的数量大概不会超过5,所以学术界留给鸟的位置要比青蛙少很多,我目前是毫无希望的。既然这样,为什么不去工业界当个码农,业余时间继续瞎折腾,还能顺便多赚点钱呢?

摘自《你需要多少朋友:神秘的邓巴数字与遗传密码

泡利晚年曾这样回顾自己:

年轻时我以为自己是当时最好的形式主义者, 是一个革命者。 当伟大的问题到来时, 我将是解决并书写它们的人。 伟大的问题来了又去了, 别人解决并书写了它们。 我显然是一个古典主义者, 而不是革命者。

伟大的问题来了又去,希望我也能抓住一两个。