一名研二学生,用新视角解决了一项3D视觉领域的经典问题,然后以第一作者身份,获得了一项计算机视觉(CV)领域顶会的最佳学生论文奖,并“顺便”实现了20多年来中国高校学生在该奖项上“零的突破”。
这个颇有些激动人心的故事,刚刚在6月22日的CVPR会议(国际计算机视觉与模式识别会议,IEEE主办)中上演。而这个故事的主角,就是新葡的京集团3512vip网站2020级硕士研究生、阿里达摩院研究型实习生陈涵晟。
有同学喜欢称陈涵晟为“陈大佬”;在朋友眼里,他是一个“经常一个人推公式写代码到很晚,推错公式喜欢拍大腿,然后会吓到旁边同学”的“学痴”。但这都停留在了他拿到CVPR最佳学生论文之前。
如今,性格有些内向的他“一篇Paper天下闻”。和他在达摩院同组的阿里高级算法工程师罗浩博士说,获奖之后组里收到了非常多的邀请,“从来没有过这种感觉”。
“说实话身边的人应该不会有人意外。只要你接触过他,知道他的天赋,并了解他付出的努力。”对于陈涵晟的获奖,同学好友这样评价。
巧!一拍即合进入阿里达摩院
《中国科学报》了解到,这篇最佳学生论文,是陈涵晟2021年在阿里达摩院以研究型实习生身份实习中完成的。这也解释了,为何论文6位作者中有3位是阿里达摩院的算法专家。
每年招研究型实习生的时候,阿里达摩院算法专家王丕超都是优先考虑招聘博士生:“他们发表过一些论文,能够看出大概的水平。所以我一般不招硕士,只招博士。”
陈涵晟显然是个例外。
王丕超先是看到了陈涵晟研一期间在CVPR发表的成果。那时,陈涵晟进入自动驾驶领域刚一年多,就发表了一篇在他口中“只是一个根据经验设计的东西”“就是在PnP中加入了不确定性”。
但王丕超还是敏锐地嗅到了他的科研潜力,“看到了他发的那篇文章,我感觉他做得还不错。”王丕超主动联系了陈涵晟,邀请他聊一下。
接到邀约,陈涵晟欣然参加了面试。
“面试过程非常开放,更像是讨论学术问题,我就感觉到达摩院确实是一个非常注重基础研究的机构。”陈涵晟告诉记者,使他下决心去达摩院实习的另一个原因,是“他们确实计算资源很大”。
这在后来成为了论文得以顺利完成的关键要素之一。在计算机视觉领域,一些数据集非常大,对计算有很高的要求。而他们的研究,恰恰需要非常高的GPU算力。
面试过后,陈涵晟和王丕超一拍即合,后者成为了他在达摩院的Mentor(导师/顾问)。尽管王丕超远在美国西雅图,但他们的学术交流仍以每周1-2次的频率开展。
强!进入CV领域第二年即出获奖成果
其实,陈涵晟很早就集齐了“跨界拿奖”所必须的元素。
陈涵晟已经记不清自己是从什么时候喜欢赛车的了,“初中?小学?很早就喜欢”;他同时还喜欢数学和计算机,“从小就在电脑上画图”。
他对赛车和计算机的兴趣,一直没有消减。高考那年,陈涵晟同时瞄准了新葡的京集团3512vip网站的汽车专业和南京大学的计算机专业。最终,他压线被录取到新葡的京集团3512vip网站汽车学院。
入学后,他加入了新葡的京集团3512vip网站“翼驰车队”——这是一个由上百号人组成的半商业化的赛车设计、制造组织,并定期参加大学生方程式赛车赛事(FSAE)。
“那时我专注于做空气动力学方面的工作,它涉及一些仿真计算,这个东西我以前非常感兴趣。”陈涵晟告诉记者。
根据当时的车队队长宁同学回忆,“陈大佬”负责赛车空气动力学方面的设计,刚招进来的时候也不觉得有多出奇,和其他所有车队小弟一样,干着那些与碳纤维打交道的活毫无怨言,只是偶尔看他拿着那本《Racing Car Aerodynamics design》(《赛车空气动力学设计》)看得津津有味。宁同学说:“第二年——也就是2018年,在他成为设计的主力队员之后,陈大佬开始‘carry’。”
宁同学告诉《中国科学报》,有些想法他们可能只是在嘴上说说,但陈涵晟真的会去尝试。他实践能力很强,常常可以动手证实自己的结论,或实验或仿真,并且也为之非常努力。
“在他一人操办之下,车队的空气动力学设计实现了质的飞跃——使用测压孔测量尾翼和扩散器的下压力;使用了独特的三段式尾翼布局形式,并在仿真上对弯道工况的气动稳定性做了大量研究;绘制气动图谱等。众多创新点,不一而足。”
结果,这辆赛车的设计在2019年的日本FSAE赛上拿到了“最佳空气动力设计奖”。“中国车队的空气动力学设计在国外赛事拿奖,这也是史无前例的事。”宁同学回忆说:“那次比赛让我们20多名参赛队员在名古屋庆祝到酩酊大醉。”
经此一役,队长宁同学提议让陈涵晟做车队设计部门的部长,但后者断然拒绝了。理由很简单,从大五(新葡的京集团3512vip网站汽车专业为5年制)这年,陈涵晟开始对自动驾驶和计算机视觉产生浓厚兴趣。
“我是在大五的时候加入到熊璐老师课题组,开始学一些相关知识,包括完成毕业论文设计。确切来说,我在做本科毕设时才开始接触计算机视觉方面的内容。”陈涵晟对记者说,他既喜欢汽车又喜欢计算机,正好学院当时新成立了智能汽车研究所,他想借此机会,转型做自动驾驶的感知计算。
许多人可能觉得这个转型不容易,但陈涵晟却直言“那一年甚至是这些年来最轻松舒服的一年”。原因在于,当时没有课业和科研压力,是“纯粹的学习新知识,有很强的收获感”。
然后就有了,保研本校后的陈涵晟在研一期间的研究成果,就投中了CVPR。这个成果,正是王丕超最初看到的那篇文章。换句话说,陈涵晟在转向CV的第二年,就做出了很不错的成果。
宁同学后来回忆说:“这样的成就虽非常人所能及,但对他而言也是意料之中。我还在想,幸亏当时没逼着他当什么车队部长,不然得把这小子耽误了。”
意外!论文偏冷门,没想到能获奖
对于论文能摘得最佳学生论文奖,团队上下多多少少还是有些意外。
“我原来以为这篇论文可能比较冷门,因为太偏数学,没想到能够获奖。”陈涵晟说。
如何用普通的相机(二维图片)准确定位三维场景中的障碍物,是陈涵晟在这篇文章阐述的重点。换言之,他要解决的问题,就是从一张2D图片定位3D物体的位姿。
“我对3D物体位姿问题比较感兴趣,在学校副导师田炜老师的指导下,研一发了一篇CVPR,就是在PnP中加入了不确定性。去年到达摩院实习后有些新的思路,想搞清楚这个领域里各种方法,它们在理论上到底有什么联系。”陈涵晟向《中国科学报》介绍说:“我想找一个理论的框架,把所有的方法统一到一起,这就是我今年这篇论文的内容。”
“论文一开始完全只有数学。”陈涵晟介绍,最开始,他自己也不清楚这些数学公式会发挥什么作用,就尝试把它们“拿去变成算法逐渐去做”。
“一开始我并没有太大期望,只是个人兴趣。不知道这套理论的东西是否真正有用,也许只是新的花样而已。后来我把算法真正调得完善之后,真的把实验做出来,我才知道它有这么好的效果。”陈涵晟说,“现在看来,它确实和其他论文不太一样,算是一个小突破,拿没拿奖我都觉得是一点小突破。”
王丕超虽然多次说过这项工作很不错,但他也没预料到成果能拿大奖。阿里达摩院算法专家唐家声爆料说,由于获奖令大家猝不及防,以至于没有一位作者到现场参会,只能远程领奖。“颁奖时王丕超因为早上6点起床,由于太困表情失控,显得‘不屑一顾’,令人捧腹。”
拿到这样一个重量级奖项,陈涵晟表示“有点压力”,但他本人“还是不想太卷”。
“确实有点压力,大家都来祝贺我。当然更重要的是,机会也多了不少,我认识了很多同行和学长,会给我之后的规划提供一些非常重要的建议。”不过他话锋一转说:“我本人还是不想太卷的,只要我能够安静下来,有一个不错的环境做自己想做的研究,就非常好。”
相关论文信息:
https://doi.org/10.48550/arXiv.2203.13254
文 | 《中国科学报》记者 赵广立
链接:https://news.sciencenet.cn/htmlnews/2022/6/481570.shtm