博士生一脸茫然:“老师,什么对应关係?”
姚院士张了张嘴,想解释,却发现需要从代数数论的基础讲起,而讲座还在继续,只好摆摆手。
“回去再说,你先记下来。”
讲台上,肖宿已经写满了三块白板。
他的笔跡工整清晰,公式推导步步为营,没有任何跳跃。
偶尔会停下来解释某个术语的定义,但绝不会为了照顾听眾而简化数学。
“最后一步,是通过伽罗瓦表示理论,將模形式的性质转移到数域上。”
肖宿写下最后一个等式,放下马克笔,“这样就得到了梅森素数个数的精確表达式。证明完毕。”
他转过身,看向台下:“现在可以提问了。”
台下沉默了三秒。
不是没人想问,而是需要时间消化刚才的信息量。
很多问题在脑海中打转,但一时不知道从何问起。
终於,姚毅智院士举起了手。
工作人员立刻递上麦克风。姚院士站起身,语气温和但问题犀利:
“肖宿同学,我有一个关於群论框架的问题。你在论文中提到,框架可以扩展到连续对称群,比如旋转群so(3)。但在实际数据中,很多对称性是离散的,或者近似对称。如何处理这种离散和连续的混合情况?”
问题一出口,懂行的人就暗暗点头。
不愧是院士,问到了点子上。
理论上的连续对称群很完美,但现实数据往往並不像想像的那么完美。
图像可能只有八个方向的旋转对称,文本可能只有有限的语法变换。
如何处理这种“破损的对称性”,是理论落地必须要解决的问题。
肖宿几乎不假思索:“用群的正则表示分解。离散对称可以嵌入到连续群的子群中,近似对称可以通过定义鬆弛的等变约束来处理。具体实现时,我们设计了一个可微的对称性度量函数,允许小幅度偏离理想对称。”
他调出了一页ppt,上面是那个度量函数的数学定义和几个实验曲线。
姚院士仔细看了几秒,缓缓点头:“很优雅的解决方案。谢谢。”
坐下时,他轻声对博士生说:“记下来,这个度量函数的设计,我们组可以借鑑。”
第二个提问的是钱卫华院士。
他问题更偏工程一些:“肖宿同学,从算法复杂度分析,你的框架在理论上是o(nlogn)级別的。但实际实现中,特別是大规模分布式计算时,通信开销会成为瓶颈。有没有考虑过针对超算架构的优化?”
这个问题问得相当专业,直接戳中了大规模ai训练的核心痛点。
我们现在的ai之所以强调大数据、大模型,本质上就是靠计算量和数据量来得到精確的答案。
再理想的框架,如果算力跟不上,也达不到想要的效果,一切白搭。
肖宿点点头,这个人提的问题还是比较关键的。
“这个问题之前已经考虑过。群论框架的特徵空间具有局部性,天然就適合数据並行。我们正在设计一种分层聚合算法,可以在保证精度的前提下,將通信量减少到传统方法的百分之三十左右。论文在投,预印本已经掛在arxiv上。”
钱卫华眼睛一亮:“arxiv编號多少?我回去马上看。”
“2309。xxxxx。”肖宿报出一串数字。
钱院士迅速记下,满意地坐下。
接下来又问了几个问题,有京大的教授,有外校的研究员,问题质量都很高。
肖宿回答简洁但精准,没有一句废话。
偶尔遇到特別基础的问题,他会直接说“这是群表示论的基础知识,可以翻教科书”,一点不留情面。
几个想浑水摸鱼刷存在感的记者,提的问题被也肖宿直接无视了。