hi@zxh
_

2023 新年快乐:进入 PhD 黑洞的史瓦西半径

Mar 24, 2023 · 17 min · life

这篇新年总结在今年已经过了快三分之一的时候才写出来,并且我上一篇中文博客还是去年的新年总结。反思一下的话,原因是去年的生活是心如止水地摸鱼和面如死灰地赶 due 的叠加态,这种生活让我的大脑停止了多余的思考,导致碎碎念写不出来,成体系的知识总结也写不出来。

这不好,这很不好,我今年不会这样了(可能吧)。


去年 12 月上完了硕士要上的课,今年 1 月拿到了电子版学位证,难以想象下载电子版学位证还要收费 11 刀。实体学位证 2 月就寄到北京了,但我现在还没收到,并且 USPS First Class 进了中国就查不到物流信息了,但愿不是寄丢了。

只有一年的在美国的时间,上完课就能拿到的学位,春季毕业生毕业典礼的缺失,再加上看上去令人担忧的学位证发放过程,一切都显得我只是出国去镀了个金,事实上我们这种连美国 top 30 都没进的学校并没有什么镀金价值好像也的确是这样。对绝大多数去美国读 CS master 的人来说,上课是不重要的,学校是不重要的,重要的只有刷题和找工作。刷题和找工作在行业景气的时候也会让人兵荒马乱,何况去年行业还不景气。当然今年的开年更加不景气,大厂一个接一个宣布裁员,我每天登上 Linkedin 都能看到首页有新的一批人在找工作。有的人 “Happy to share that I will start a new position at XXX!” 和 “I got impacted by layoff. I am open to work.” 的帖子之间可能就隔了不到一个月。在同一个公司工作了二十多年,毕业以后就没换过工作的员工也是说裁就裁,这就显得会因为应聘者跳槽太多而认为他们“忠诚度”不够的公司就像个笑话。很多今年春季毕业的 new grad 拿到手的 offer 也在临近毕业和入职的时候被取消了,亚麻还搞出了把一些人的入职日期推迟六个月这种事,导致国际生根本没法申 OPT,跟取消 offer 也没啥区别。与此同时国内的情况也比较萧条,谁都劝我别回国。

当然这些抱怨由我说出来有一些隔岸观火的滑稽,因为我不找工作。

不找工作的硕士生毕了业以后要么继承家业,要么读博。虽然我时常鼓励父母要争取暴富以实现我当富二代的理想,但我目前还是没有家业可以继承,因此我得去读博。实际上我本来依然留有一个毕业后直接打工的念想,在原定的计划里我暑假是要去一个搞 AI 的 startup 里实习的。但在我入职前不到一个月,公司开始停止招实习生并裁员,我 mentor 都被裁了,于是失去实习的我彻底打消了这个念想。

我看了不少大佬的博士申请回忆录,那是无数条从动机到准备到挣扎到被录取后的突然松弛的脉冲波形。看了以后我觉得被指明了方向,并感到血管里突然流动着脉冲星风云(我也不知道我为什么写出了这种比喻)。但不久以后血管里的东西就又变回了平静的人类血液,我开始思考我真的需要这个博士学位吗。看了我写过的奇怪的前端项目的网友说我看上去不像是那种会享受科研的人,如果“享受”是指“热爱”和“将之作为义无反顾的事业”这种程度的话,那我觉得这句话很准确。我一点也不反感这几年在各种地方科研搬砖时的体验,甚至觉得这种生活挺不错的,但这种感受的前提是我总是给自己留出了足够的摸鱼时间、公司和学校往往都对实习生没有太高的要求以及没有经济压力。但如果是在穷困和高压的环境下,我想我是没法清心寡欲的科研的。我那个“do impactful work”的愿望也远远没到会影响我职业规划的程度,何况“impactful work”跟博士学位并不挂钩。

在美国的这一年对我最大的影响可能就是让我觉得,我并不是一定要特别努力特别厉害特别精细规划特别在意某些条条框框才能过上我想要的生活。我不知道这种想法是怎么产生的,明明这一年对美国来说并不容易,但我就是那么想了。以前我觉得有的人本科毕业前发了一堆顶会,从机器学习精通到 CUDA 优化再精通到 Linux 内核,最后申到了 MIT 的 CS PhD,简直让我这种菜鸡抬不起头。现在我觉得我想要的未来又不是非得申上 MIT 的 PhD 才能实现,甚至不是非得读 PhD 才能实现。摸鱼会让我变菜,但菜又不影响我生活,那菜就菜呗,安心摸鱼吧。

这种摸鱼思想让我在做决策时少纠结了很多,最后促使我申博的最重要的理由是“我就是想要个博士学位”,我不确定这个学位是不是一定对我有好处,但至少不会有坏处。至于可能存在的风险,最坏的情况也就是我读不下去了退学嘛,以前我会很担心这一点,现在我觉得我也不是损失不起这四五年,何况拿不到学位也并不等同于时间的完全损失。那么接下来我就应该为我的论文发表情况而焦虑了,但我的摸鱼思想又让我去翻了翻我看上的老师们的学生们的主页,最后得出了“也不是一定要顶会才有书读嘛,我现在的背景好像也够用了,毕竟我又不申 top program”的结论。虽然后来的申请结果(又又又只有一个 offer,虽然我 withdraw 了几个学校)证明了这个结论还是太天真了,但至少它让我在申请季的心理状态一直很平稳。

申请季值得纪念的事有两个。一是绝大多数博士项目的申请截止时间在 12 月,那时候 ChatGPT 刚出来,并且因为用的人还比较少所以响应比现在快很多,于是我快乐地用它来润色我的各种申请文书。这是我第一个脱离了人工文书润色服务的申请季,应该也是最后一个。二是一次面试的时候被问了“为什么大一大二的绩点那么低,甚至挂过数学课”,于是我开始陈述我大一大二时的心理状态,接着我开始陈述我高中时的心理状态,然后我开始哭…我猜对面应该没见过在博士面试现场哭出来的申请者,我也没想到那么多年过去了我还是会在讲到这种事情的时候哭出来,我更没想到这就是后来唯一一个给我 offer 的学校。

接了 offer 以后开始跟组会,感觉组里博一学生的表达能力、知识储备和敏锐程度也比我强太多了,每次都有一种“他们真的只比我高一届吗”的想法。高中和大学的经历让我认识到我的能力并不一定会随着资历而增长,就算我熬到前辈们的资历也不一定会有前辈们那么厉害。于是我一直把巴蜀给我的保送资格和同济给我的自招降分都算做它们的招生事故,但愿这种跟随我一路走来的招生事故能在我的博士导师那儿终止。

说到同济,同济去年在上海封城的那段时间出了不少离谱的事,比如给学生吃生的猪肉、比如把铁岭校区的博士生从原来的宿舍赶出去、比如在上海交大允许学生回家时跳出来说这是造谣然后被交大打脸、比如软院某辅导员对学生算是无理的莫名指责、比如有学生在学校领导在 zoom 上开疫情报告会时共享屏幕展示了一些宣泄愤怒的文字。那段时间遍地是同济的负面消息,好多消息还是从别的学校的看乐子的同学那里传到我这儿来的。我以前还以为同济只是嘉定的管理水平和态度拉垮,毕竟 21 年嘉定搞出过考研前一周食堂大面积食物中毒并且学校还压消息的事,后来才知道本部的乌鸦也一样黑。再后来政策转向,当时死活不让你走的学校的态度突然就变成应滚尽滚赶紧给我滚了。

当然拉垮的也不只是同济,同济只是上海的缩影,那上海又是什么的缩影呢?

同样,这些抱怨由我说出来也有一些隔岸观火的滑稽,因为我不在国内。

所以除了年底的时候担心家里的人买不到药(回国的时候我甚至还带了两罐泰诺)以外,疫情对我基本没啥影响。我上半年的主要压力来源于 CS 538 密码学,对于我这种没有密码学和数论基础的人来说这门课可太难了,我小学毕业以后就没体会过这种用尽全力听课复习但作业和考试就是不会的感觉了。选这门课是因为听说老师是密码学领域的大佬、觉得反正我也没有找实习的压力不如整点没整过的东西、被同学“没事我们几个一起做作业总有人做得出来的”给忽悠了(最后谁都做不出来)。再加上期中考试前的作业都是那种虽然难但我努力死磕一下还是做得出来的,这种反馈给人的成就感太高了,是其他课给不了我的感觉,于是我就这样错过了退课时间。期中考试后的作业就一次比一次更让人绝望了,最后两次作业我基本都是瞎编的,反正都是证明题,固定已知条件固定结论,证明过程漫天飞舞。我得说老师是懂难度曲线的,不去设计点游戏可惜了。期末考完以后我发了条朋友圈:

考密码学就像考文科,我知道我写得不对,但我必须得写满。

我上半年能活下来是因为有 CS 506 Data Science Tools and Applications 这个水课来中和 workload。说它水是因为它的定位略显尴尬,作为研究生级别的课程,它教的是非常基础的机器学习入门内容,而对机器学习感兴趣的研究生大概率早就会这些了。于是这门课的学生基本上由本科生、外系学生、想找门水课混学分的学生(比如我)组成。这门课有一个小组项目,项目需求会由一些企业和机构根据实际需求来决定。我觉得我对我们组最大的贡献就是迅速挑出了最简单的项目,最后我们调 pyecharts 画了些数据可视化就应付过去了。

至于 CS 585 Image and Video Computing 是一门中规中矩的讲计算机视觉的课。讲了很多传统算法,对成长在深度学习时代下的我来说是个有效补充,老师讲得也挺好,虽然可以明显的看出来这课的作业照抄了 UIUC 的 CS 543 Computer Vision…不过考虑到老师是在 UIUC 读的博,这就非常说得通了…

下半年我只用选两门课就能毕业,其中一门我还通过去老师那做研究项目抵了学分,于是最后只选了 CS 655 Computer Networks,这也是门中规中矩的讲计网的课,对本科几乎把计网课翘光了的我也是个有效补充。那个带我做研究的老师也很好,那个时候我想只要老师看得上我我就在这儿读博,这学校我也熟悉不用重新适应,波士顿住着也舒服(就是物价房租实在太高了)。但老师说今年他们经费不够招不了什么博士生,原话是“it’s a tough year”,这下我终于感受到美国的水深火热波及到了我。最后我申请的时候直接跳过了本校。

总之我入学前并不觉得 BU 是个很好的学校,但它后来确给了我很好的体验,以至于让我想把博士几年也耗在这儿。当然也有不好的体验,比如行政类的邮件处理得也太慢了。

回国前我得卖掉一些二手物品,我在隔壁公寓楼的微信群(里面基本上是 BU 和 NEU 的中国学生)和 Facebook Marketplace 上发了信息,都是一手交钱一手交货。微信群里说要买的人都很靠谱,说多久来取就多久来取,没人鸽我,但 Facebook 上的人就很让人心累了。我得出的经验是绝对不要相信“我明天来取”甚至“我今天下午来取”这种话,我都快被鸽傻了。实行先到先得政策就好,如果有人说明天来取,那就告诉对方如果明天东西还没卖出去的话你可以来取,然后继续物色下一个买家。最后我的大件家具基本上被一个刚来美国的隔壁 NEU 的印度新生拖走了,她太靠谱了,说三天后带人来搬就真的三天后带人来搬了,让快被 Facebook 上的人鸽傻了的我感到了一些温暖。并且 Facebook 上也有上来就说“我是学生”然后把价格砍一半的人,奇怪的全球通用的事增加了。


我想起 Kurzgesagt 在他们 2019 年的最后一个视频结尾时说:“The world is screwed up”。但现在看来,与动荡而魔幻的 2020 和 2022 相比,2019 正常得在回忆中都有些模糊和不真实。去年的上海经历了一段把可乐当成硬通货的时期 —— 听上去就像《辐射》中废土世界上的核子可乐瓶盖。去年也出现了另一些和上海一样如雷贯耳的地名,比如徐州,比如唐山。我们越来越难去谈论一些基本的理所应当的东西 —— 它们被认为是万恶的西方国家的负面特质和政治阴谋。总之大家去年失去了太多的东西,希望今年可以快乐一些。

也希望我今年可以当一个快乐的博士生。

2021 年的时候 OpenAI 搞出了 CLIP,于是所有的任务大家都要拿 CLIP(或类似的思想)来做一遍。2022 年底的时候 OpenAI 搞出了 ChatGPT,于是所有的任务大家都要拿 ChatGPT(或类似的思想)来做一遍,学术界永远在循环。当然 ChatGPT 的影响力要大得多,大得让搞 AI 的博士生和研究人员都得重新思考一下自己以后的研究方向和职业规划。大模型、大数据、大算力堆出来的模型好用得让人绝望,当然敢于砸那么多资源去这些领域里开荒并且工程能力也称得起野心的公司也让人敬佩。我想起我就是在 LLM 开始盛行的时候对 NLP 失去了兴趣,我几年前对 NLP 感兴趣是因为 SeqGAN 和 Dual Learning for Machine Translation 这两篇工作(虽然后面一篇的可复现性存疑),那时候 NLP 领域各种邪道方法百花齐放,我觉得真有意思 —— 然后 Transformer 出来了,再然后 LLM 一统天下了。大型预训练模型的确好用,太好用了,谁能说它们不好用呢?但我就是对这他们提不起兴趣,一年前我还安心觉得这种有用但我觉得无聊的东西有那么多人在做就行了,反正我不做(也没资源做)。但现在我开始担心会不会在不久的将来,不做这些就混不下去。

不过没关系,我还有那么长的时间来思考这些问题,反正博士毕业前我是靠导师的 funding 养活。

然后是老生常谈的反思我的社交状态。我终于意识到过去的那么多年里我一直是在被动获得朋友,中学时是同桌和室友,大学时是室友。能在那么小的范围里找到可以成为我的后盾的朋友们,算是非常幸运了。但这种被动让我逐渐失去了(或者就没有拥有过)社交的动力和能力,毕竟光靠幸运交朋友是不行的,何况以后我连经常见面的室友都不一定有。我想起以前在 Github 上被问过好几次要不要建个群,比如 VuePress 主题 Gungnir 还在活跃更新的时候,Zhengqbbb 问过我要不要开个 Discord server。我每次都说我好忙我没空维护群,但现在想想我哪里忙,我明明一直在摸鱼,我就只是缺乏与一群不熟的人进行交流的动力而已。如果真能有个(我在里面活跃的)群还是挺好的,不管这个群是聊什么的,有价值有力量的结论往往都是要经过多轮的沟通、碰撞甚至批判才能形成的,哪怕这些结论并没有什么用。

去年认识了热情而温暖的朋友,就像距离适中的恒星,我觉得我能够当个红巨星就非常不错了。

那么综上所述,我 2023 年的愿望是当个快乐的红巨星(这都啥玩意儿

新年快乐朋友们。


最后的最后,虽然我知道我的博客没什么人看,但如果有人愿意带我打《怪物猎人:世界》就更好了。