2025年12月12日晚7点,由中国图学学会主办的中国图学学会“奋发图强”青年人才学术沙龙2025年度第四期(总第32期)在线上成功举行。本次沙龙以“三维认知与生成前沿探索”为主题,旨在多学科视角下探讨如何突破三维几何、世界模型、具身智能及数字人研究中的表征、数据与建模瓶颈,推动构建高保真、多模态、可交互的未来世界模型新范式。活动通过腾讯会议进行,并在哔哩哔哩“图学大讲堂”、微信视频号同步直播,吸引了相关领域650余位师生和研究人员的关注与参与。
本次沙龙由第十届中国科协青年人才托举工程入选者、华东师范大学计算机科学与技术学院研究员谭鑫策划组织并主持。首先,他对参会的师生以及线上观众表示热烈欢迎,并介绍了本次沙龙的选题背景。他指出,随着人工智能从理解二维信息迈向全面认知三维世界,如何让机器具备对空间、物体、动作及动态环境的准确建模与生成能力,已成为推动下一代智能系统的关键课题。
在学术报告环节,四位来自国内顶尖高校及科研机构的青年学者分别分享了他们最新的研究进展。
首先,来自重庆大学计算机学院副教授王逸群老师,他作了题为《复杂场景高保真表面几何重建与脏几何鲁棒处理》的报告。他系统地介绍了团队在几何重建与脏几何处理方面的研究进展,并详细阐述了如何通过技术手段实现高频细节恢复与噪声鲁棒的几何重建,以及针对复杂光泽场景的几何与材质建模。此外,他还分享了自适应收缩包面网格生成等技术,展示了如何实现对复杂场景的高保真几何重建和对拓扑错误的鲁棒处理,为后续的仿真与渲染任务奠定了坚实基础。
其次,来自南京大学智能科学与技术学院准聘副教授范琦老师,他作了题为《从帧到世界:面向世界模型的长视频生成》的报告。他深入探讨了面向世界模型的视频生成应具备的核心特性,并以 Macro-from-Micro Planning(MMPL)方法为例,展示了如何将帧级视频建模推进至契合世界模型的新范式。他提出的这种新架构有效缓解了自回归长视频生成中普遍存在的时域漂移与串行推理瓶颈问题,为该领域提供了新的研究思路。
然后,来自上海人工智能实验室具身智能中心的青年科学家曾嘉老师,他作了题为《InternData-A1:支撑国际一流VLA训练、效能比肩顶尖真实数据的合成数据集》的报告。他介绍并发布了大规模开源机器人操作仿真数据集 InternData-A1。该研究首次证实,仅依赖基于高度自动化、完全解耦引擎构建的纯合成数据,即可在 VLA 模型预训练中达到与国际最强真实数据集同等的性能水平。这一成果有力打破了具身智能领域的数据壁垒,为行业提供了低成本、可扩展的数据底座,加速了 VLA 模型的智能涌现探索。
最后,来自西湖大学助理教授、远兮实验室负责人修宇亮老师,他作了题为《走出蜡像馆,交互新世界:开拓三维数字人研究新疆域》的报告。他将数字人研究划分为聚焦外观的“静态”方向和侧重动作交互的“动态”方向,并形象地比喻这一过程为“走出蜡像馆”,还分享了西湖大学远兮实验室的三项最新成果:基于“脏数据”的个性化建模(UP2You)、从三维着装人物中精准解析人体参数(ETCH),以及从海量互联网视频中实时完成人物动作捕捉与三维环境重建(Human3R)。这些工作为探索人与环境的交互、乃至构建立体世界观提供了关键技术支撑。
本次“奋发图强”青年人才学术沙龙的成功举办,汇聚了三维几何、世界模型、具身智能及数字人等多个前沿方向的深度思考。四位讲者的报告主题鲜明、见解独到,不仅展示了最新的科研成果,更为青年学者搭建了高水平的沟通交流平台。与会者纷纷表示,通过本次沙龙对三维认知与生成的未来发展方向有了更清晰的认识,受益匪浅。

BIM建筑网