首页   

2024年终总结:AI开始颠覆世界

老顾谈几何  · 数学  · 2 天前

正文

今天是2024年12月31日,笔者夜不能寐,随手总结一下2024年的心得体会。历史一定会记住2024年,这一年AI真正开始颠覆世界,计算机科学开始涅槃重生,基础数学的重要性真正被重新认识。

12月上旬,突闻清华大学计算机系关于严蔚敏教授的讣告,非常震惊和痛心。笔者曾经上过严老师亲自教授的“数据结构”课程。严老师的严格训练,为笔者终生的职业生涯奠定了坚实的技术根基。时至今日,笔者几乎每天都在用C++开发几何算法,数十年优化基于指针的各种复杂组合、拓扑、几何数据结构,在流形上求解各种偏微分方程。每当被指针操作搞得焦头烂额之际,总会回想起严老师的严格清晰和一丝不苟。如今笔者清华计算机系的同学早已天各一方,从北京到深圳,从硅谷到纽约,笔者经常访问当年的老同学,大家都在过着优渥的生活。每当回忆往事,大家都会深深地感谢清华的老师,庆幸当初的职业选择,感谢时代的丰厚红利。但是,近年来AI的发展正在打破计算机领域从业人员养尊处优的生活,为信息行业带来深深的隐忧。

笔者当年所接受的计算机科学教育非常宽泛,但是历经数十年,笔者体会最为基本的核心只有两条:程序=数据结构+算法;算法设计的原则是自顶向下,逐步求精。计算机科学中的基本数据结构包括链表、树、队列、堆栈和图,大量的基础算法都是围绕这些数据结构的创建、更新、维护和消除来设计的。笔者的日常科研中经常用到图论中的大量算法:生成树、最短路径、最大流最小割、深度宽度优先搜索等等。同样基本的是数值算法和优化算法,例如QR分解,奇异值分解,共轭梯度,单纯形法与各种规划法等等。AI在2024年的发展已经能够完全自动地设计这些基本的数据结构,生成这些基本的算法。这为计算机科学的教育方向,和信息产业的发展模式带来了颠覆性的改变。笔者亲身体会发现,目前70%的C++代码可以由AI来高效完成,人类的进一步改进占比30%左右(这种改进会占据90%的开发时间)。笔者认为经典的计算机科学准则“程序=数据结构+算法”中,数据结构基本上可以被AI来取代,但是算法部分依然仰仗人类开发者。

计算机科学算法开发准“自顶向下,逐步求精”中底层算法可以由AI来开发,人类来负责顶层算法设计。AI目前只能处理相对成熟的、有章可循、循规蹈矩的算法生成一般软件系统的整体架构设计由人类完成,同时大量的边界条件,特例处理也由人类完成。更为关键的是大量软件的顶层算法思想来自于其他领域,尤其是基础数学、物理、机械、生物医学和其他理工科领域。例如工业仿真软件的顶层算法来源于物理定律、数值偏微分方程、代数拓扑和微分几何。未来的计算机工程师更多的是基于这些领域的知识进行算法设计,而非动手编写底层代码这实际上极大地提高了于软件工程师素质的要求。很多现代数学和物理中的概念和理论目前人类还没有发明相应的计算方法AI自然也不会生成算法。相应的算科学教育中,底层编程训练将会大幅度减少,更多的被基础数学和物理训练所取代。

2024年AI的发展使得基于概率统计的生成模型几乎耗尽了人类所有的数据,Scaling law将近失效同时基于逻辑推理的模型真正崛起基于思维链的ChatGPT 4o模型求解数学问题方面突飞猛进。笔者尝试用AI求解一些抽象代数问题,目前AI模型具有清晰的思维链,明确知道推理的步骤和每一步需要达到的目的。对于一般常见的问题,能够给出完整清晰的解答。但是对于需要一定特殊技巧的步骤,往往力有不逮,并且以欺骗的方式蒙混过关。这对于初学者而言,存在一定的风险。对于现代数学理论,AI可以给出条理分明的概述,罗列主要的概念、定理、证明思路和步骤,非常适合初学者自学数学,这极大地降低了学习现代数学的难度。但是,AI生成的内容停留在归纳、总结经典教材的阶段,目前无法融会贯通,深刻理解,更遑论理论联系实际。基础数学的研究是拓展人类对于自然的认识,建立新的概念、新的语言来表达自然的结构,往往需要发明新的技巧目前的AI并没有建立抽象概念的能力,也无法洞察自然结构,对于基础数学的研究能够起到辅助作用,但是无法替代人类

图1. 米开朗基罗的大卫(意大利佛罗伦萨美术学院,网络)。

者年末游览了意大利的罗马和佛罗伦萨,看到了大量的艺术雕塑,特别是米开朗基罗的大卫雕塑,这令笔者激动不已。在过去的30年间,笔者一直从事计算3维计算机视觉、数字几何处理、计算机辅助几何设计和计算共形几何方面的研究工作,经常用大卫雕塑的数字曲面作为算法验证的几何模型。在攻读博士期间,笔者在丘成桐先生的指导下,计算出来大卫雕像上的阿贝尔微分。这一次真正膜拜了米开朗基罗的不朽杰作,十分感慨。佛罗伦萨圣母百花教堂、梵蒂冈的圣彼得教堂宏伟壮观,气势磅礴。圣母百花教堂的穹顶跨度半径长达43米,没用飞扶壁来抵消巨大穹顶带来的侧推力,建筑过程中也没有搭建拱鹰架来维持结构的稳定性,堪称奇迹。教堂表面覆盖着意大利国旗3原色(红、白、绿)的天然大理石和各种精美浮雕。梵蒂冈的圣彼得教堂是最杰出的文艺复兴建筑和世界上最大的教堂。内部设由大理石、浮雕、建筑雕塑和镀金所构成的精致装饰,包括米开朗基罗的《圣殇》(4)。

图2. 大卫雕像上面的第一类阿贝尔微分。

在佛罗伦萨,笔者了解到传统意大利雕塑师制作大理石雕像的过程:首先制作一个小型的石膏雕像,然后在石膏雕像表面定义很多特征点,再用3维缩放仪(pantograph)将石膏像上特征点的坐标等比例放缩,映射到大理石材料块上,然后用雕刻工具在大理石上凿出大致形状,最后再精雕细刻处理局部细节和纹理。现代数字几何处理方法极大地简化了这一过程,笔者曾经涉足了这一领域的各个关键算法目睹了这一领域的历史演进过程。第一步是3D扫描,特别是基于结构光的相位平移算法,这里的关键是相机标定算法、结构光编码算法和相位反包裹算法基于Ising模型的马尔科夫随机场算法是最为有效的传统算法基础是大流最小割图论算法;然后是点云配准融合算法,这里用到李代数和Hodge分解;再次是曲面重建算法目前比较有效的是基于泊松方程的方法,得到高密度的初始曲面;然后是几何压缩重网格生成算法,这里需要用到计算共形几何的里奇流算法和经典的平面Delaunay三角剖分算如此得到的高质量三角网格可以用于游戏与影视业,也可以3D打印出来如果需要进一步转换成传统制造工业中的样条曲面模型,则需要进行规则边形网格剖分,这要用到黎曼面理论中的Abel-Jacobi定理黎曼-罗赫定理。如此得到的CAD模型可以作为数控机床(CNC)的输入来雕刻大理石。马和佛罗伦萨遍地都是大理石雕塑,街头巷尾都有各种经典大理石雕塑的微型复制品售卖。洁白的大理石雕塑,配有红色、绿色大理石基座,精细的几何结构,栩栩如生的表情,令人爱不释手。在罗马斗兽场的书店,也有经典雕塑的微型复制品,但是这些复制品都是3D打印而成,虽然更加逼真,但是缺乏大理石特有的光泽和质感,特别是手工制作的灵性。

图3. 数字几何方法生成的犹他壶上的大卫浮雕。

图4. 米开朗基罗的圣殇(梵蒂冈圣彼得教堂,网络)。

徜徉在古罗马的老城,举目都是宏大的建筑遗迹和精美的雕塑残片,笔者深深体会到古意大利人对于艺术的狂热和对实体几何的挚爱。现代的代数几何很大程度上也是起源于意大利学派。笔者所从事的计算共形几何本质上就是代数几何、复几何、微分几何与计算机科学的交汇所在。2024年,笔者受丘成桐先生的嘱托,讲解了计算共形几何的课程。与往年相比,今年的课程增加了三维流形的拓扑,特别是双曲三流形的理论和计算。这是因为离散曲面里奇流理论可以被双曲三流形的刚性定理推导出来,这个途径更加几何直观,因而更加自然。我们也涵盖了经典的黎曼面理论,特别是Abel-Jacobi理论和黎曼-罗赫理论。比较现代的讲法是用全纯线丛截影层的上同调理论来解释。这种讲法抽象而优美,并且高屋建瓴,可以直接向高维复流形推广。但是这种讲法过于抽象,无法为算法设计提供灵感,因此我们采用比较古典的途径来讲解黎曼罗赫定理,这种方法用几何偏微分方程理论,直接构造解空间。

图4. 黎曼面上的亚纯函数。

2024年,中国新能源汽车产业如火如荼,成为替代房地产的经济引擎,引发了日本和德国汽车工业的衰落。年底多次航空悲剧,昭示着波音公司的日薄西山。全球制造业翻天覆地的变化也推进着工业软件的发展。计算机辅助几何设计CAD的核心是如何用样条曲面来表达复杂几何曲面,计算机辅助工程CAE的核心是如何在几何体上求解偏微分方程来模拟多物理场。这些都需要将曲面(几何体)进行结构化网格剖分,最为常见的是四边形网格化。局部上,将曲面片进行四边形剖分非常容易;整体上,将局部剖分粘和成整体四边形网格非常困难。这种将局部几何构造向全局推广而遇到的整体障碍,在现代几何和拓扑中经常用某种上同调理论来刻画。曲面结构化网格剖分对应的就是黎曼面中的黎曼-罗赫理论。笔者科研团队取得了很多学术进展,最为突出的就是有关黎曼-罗赫理论的计算框架的确立,博士生朱一鸣、孙嗣权做出了主要贡献。

图5. 黎曼面上的Abel微分。

复变函数论中的各种概念可以直接推广到黎曼面上,最为核心的概念是亚纯函数和亚纯微分(Abel微分)。紧黎曼面上的所有亚纯函数构成一个域,两张黎曼面共形等价当且仅当它们对应的域彼此同构。图4显示了亏格为一的黎曼面上的亚纯函数,其零点、极点和留数被显示出来。黎曼面上的亚纯微分局部上是某个亚纯函数的微分。图5显示了黎曼面上的各种Abel微分。亚纯函数和亚纯微分完全被其零极点所决定。给定黎曼面上的离散点集(即所谓的除子),零极点落在给定除子位置的亚纯函数、亚纯微分构成两个线性空间,这两个线性空间维数之差与除子中点的个数与曲面的亏格满足特定的关系,这就是黎曼-罗赫定理。从现代观点来看,给定除子,我们可以构造相应的矢量丛(全纯线丛),局部上全纯线丛的全纯截影构成特定的层,所有整体的全纯截影构成层的零阶上同调群,而全局全纯截影的障碍表达成层的一阶上同调群,层的欧拉数定义为两个群维数之差。黎曼罗赫定理用曲面的亏格和除子的度来表示层的欧拉数。全纯线丛的全纯截影芽层的上同调群与Dolbeault群同构,后者又与丛值调和微分形式群同构,调和形式满足特定的椭圆型偏微分方程。因此黎曼罗赫定理连接了分析和拓扑,同时表达了矢量丛的示性类,在黎曼面理论中占据中心地位。

图6.大卫雕像上的共形平直度量,由里奇流计算所得。 

黎曼面理论中的核心定理有两个,一个是单值化定理,一个是黎曼-罗赫定理。单值化定理的要义是说如何通过高斯曲率构造共形的黎曼度量。在丘先生的领导下,我们团队在2018年从理论上彻底解决了这个问题,从而发展了离散曲面里奇流理论(图6)。黎曼-罗赫定理的计算一直是悬而未决的开放问题。依随社会对工业软件需求的增高,我们认识到结构化网格生成的理论基础在于黎曼-罗赫定理。即曲面的四边形网格是某种特定全纯线丛的整体亚纯截影,满足特定奇异点条件四边形网格构成的空间由黎曼-罗赫定理来刻画。求取这个空间的基底成为计算共形几何领域中的一个关键问题,自然也是CAD、CAE领域中的关键问题。传统的代数几何方法是将黎曼面表达成一条代数曲线,(代数簇,即二元多项式方程的零点集),这样用代数方法计算多项式环中的特定理想。在现实工程实践中,算法的输入曲面都是物理实体的表面,多为三维扫描得到的曲面或者CAD设计得到的样条曲面。将这些实际曲面转化为代数曲线,目前并没有成熟算法,同时即便能够转化过去,其数值误差也难以控制。因此,我们发展的算法是基于几何分析方法直接在三角网格上进行数值计算,涉及到复杂的拓扑操作和求解几何偏微分方程,计算结果也可以直接应用于工业几何模型上面。在算法的发明过程中,主要还是人类的逻辑思维和几何直觉起到了决定性的作用;当然在算法的实现过程中,我们用AI写了底层的一些基本数值算法,极大地提高了开发效率。

目前AI领域的下一个发展方向是空间智能。目前的空间智能处于三维重建的阶段,即由2维图片生成3维实体。目前AI的三维重建方法依然比较粗糙,到达不了基于结构光的精密程度,因此只能用于游戏媒体领域。对于工业测量和医学影像的三维重建,依然是传统方法为主导。那么空间智能的AI是否会像Alpha零一样,摒弃人类数千年积累的几何拓扑知识,独立发展出一套完全不同的几何拓扑理论,人类数学家不得不放弃自身的理论系统而拜倒在AI脚下?笔者认为目前基于概率统计的生成式AI是无法发展出这种理论体系的。因为现代数学中的大量概念过于抽象,远离可观测的物理世界表象。比如黎曼面上亚纯函数概念(图4、图5),目前只存在于基础数学理论之中,而无法通过自然或者人为的方式构造出来,因此无法得到成规模的训练数据集。那么,只有基于逻辑推理思维链的AI才能够独立创造出新的理论。并且,AI在基于公理体系中独立搜索的范围更广,深度更深,可以轻而易举地发现被人类忽略的定理。那么,AI发展的理论是否和人类发展理论兼容?笔者认为这是必然的,因为自然规律、几何拓扑结构都是客观的,不依赖于发现者是碳基生物还是硅基AI,但是人类和AI是否能够深入交流将会成为另外一个问题。比如,我们分析一下能够解析蛋白质结构的AlphaFold。笔者的生物学家朋友Yuying曾经告诉笔者,其实生物学家都知道蛋白质结构预测问题是具有因果性的问题,其维数是384维,但是目前的理论发展水平无法明确将因果性表达出来。人类结构生物学家花费了巨大的努力,解析了大量的蛋白质,建立了严格干净的数据库。基于这些宝贵的数据AlphaFold发现了唯像的定律,从而可以预测蛋白质三维结构,但是目前缺乏理论解释。类比于第谷花费毕生努力收集了大量的天文数据,开普勒基于第谷的数据总结了天体运行的三大定律,这些定律是唯像的,无法从理论层面解释,最终牛顿发展了力学定律,从而完美地解释了开普勒定律。AI目前擅长于从海量数据中寻找特定模式,发现潜在因果关系,总结成唯像规律,但还不擅长提出抽象概念,找出抽象结构,发展系统理论。

生成式AI目前正在淘汰大量的人类艺术家,例如工业产品设计人员,美工摄影等等,也必然会淘汰大量的底层软件开发人员。这里涉及到知识产权溯源问题。目前ChatGPT o4在回答数学理论问题时,总会在答案后面附上答案参考的书籍和学术论文,但是在生成代码时不会给出所参考的代码作者,其他生成式AI在生成图片或者短视频时,也不会给出所参考的人类作品。笔者一直在研究生成式AI,对于生成图片、视频和3D模型而言,AI系统是能够溯源,找到哪些人类作品启发了当前生成的内容。但是,没有任何AI公司提供溯源功能,都是半欺骗半营销地宣称AI独立生成的作品与人类的知识产权无关。在代码生成领域,这一问题尤其严重。生成式AI依赖所谓的强化学习,即通过与人类使用者的交互,提高其系统性能。那么如果某个研究人员发明了新的算法,通过强化学习教会了AI,那么这项发明的产权无法得到保障。笔者的一些学生都在北美的顶级IT公司里卷大模型。他们经常向笔者抱怨被公司压榨,高强度地开发新的AI模型,而深深地感到“正在为自己掘墓”。目前微软将编译器与Copilot绑定,程序员的底层编程能力必将迅速退化,从而不得不依赖于AI才能编程。这样,IT工业必将被AI巨头所垄断。如何防止AI垄断保障人类的尊严和权益目前正在变得日益并非没有技术手段来保障,而是需要未雨绸缪,建立相应的法律和制度。

2024年,世界局势发生重大变化,AI开始颠覆世界。2025年,世界格局更加动荡,人类和AI的关系更加充满不确定性。人类智力的尊严已经退守到基础科学理论,计算机科学必将迎来一场颠覆式的革命!




 





© 2024 精读
删除内容请联系邮箱 2879853325@qq.com