“紧张?你看佐藤事件他紧张了吗?直接围脖甩清单打脸,那叫一个乾脆利落。”
“也是……不过这次不一样啊,现场提问,万一答不上来怎么办?”
“答不上来?兄弟你是没看肖神的论文吧?他那套理论,我敢说台下能完全听懂的不超过五十人。还提问呢,能问出像样问题就不错了。”
“臥槽,这么夸张?那我岂不是来当气氛组的?”
“自信点,把『岂不是去掉。咱们就是来见证歷史的,听懂多少算多少。”
一点五十分,陈景明、顾清尘、江明远跟著一眾京大领导入场,在前排嘉宾席就座。
江明远满脸红光,看著座无虚席的讲堂,心里已经在盘算今年的招生宣传片该怎么剪了。
一点五十五分,讲堂里的灯光暗了下来,只留下讲台上的照明。
嘈杂声渐渐平息,所有人都屏住呼吸,看向舞台侧方的入口。
一点五十八分,肖宿出现了。
他还是那身打扮,浅灰色t恤,深色牛仔裤,黑色双肩包。
走上讲台的步伐平稳,放下背包,插好u盘,打开ppt,调试麦克风。
整个过程行云流水,花了不到一分钟。
两点整。
肖宿抬起头,看向台下。
八百多双眼睛聚焦在他身上,那种被注视的压力足以让任何人紧张。
但他的语气依旧平稳。
“我是肖宿,今天讲群论在自监督特徵解耦中的应用,以及周氏猜想证明中的方法技巧。”
没有开场白,没有感谢致辞,除了名字外没有多余的自我介绍,直接进入正题。
台下静了一瞬,然后响起低低的笑声和议论。
“这也太直接了吧……”
“肖神风格,符合人设。”
“我喜欢,不浪费时间。”
讲台上,肖宿已经点开了ppt第一页。
標题很简单:“群作用下的特徵空间统一表示”。
“传统多模態学习的问题在於,不同数据类型的特徵空间是异构的。”
肖宿的声音通过麦克风传遍讲堂,清晰而平静。
“图像用卷积神经网络提取特徵,文本用transformer,语音用梅尔频谱。这些特徵向量维度不同,结构不同,度量不同。强行融合就像把苹果和橘子加在一起算总数,没有意义。”
他在白板上画了两个不相交的圆圈,分別標註“图像特徵空间”和“文本特徵空间”。
“我的思路是,引入群论作为统一框架。”
肖宿切换ppt,出现了一个复杂的数学结构图。
“所有数据模態,经过编码器映射到同一个群表示空间。在这个空间里,图像旋转、文本语法变换、语音时移,都可以看作群作用。”
台下,姚毅智院士眼睛一亮,迅速在笔记本上记下几个关键词。
“关键在於对称性约束。”
“每个数据模態都有其內在对称性。”
“图像有旋转、平移、缩放对称;文本有语法、语义对称。”
“自监督学习的目標,是在保持这些对称性的前提下,解耦出独立的特徵因子。”
他调出了一段代码演示。
屏幕上,一个简单的神经网络正在训练,输入是未標註的图像和文本对,输出是解耦后的特徵向量。