GDSIG 广东省图象图形学会
2024年12月21-22日,广东省图象图形学会在深圳市南方科技大学南科大会议中心圆形会议厅举办了第十四届粤港澳图象图形学术会议暨AAAI2025预讲会。会议由广东省图象图形学会主办,南方科技大学和哈尔滨工业大学(深圳)承办,中国图象图形学学会广州会员活动中心协办。
本次会议探讨近年来图象图形领域关于大模型的科学与技术问题,邀请了图象图形领域知名专家学者做专题报告,吸引了包括广东省图象图形学会理事、广东省内乃至全国各大高校教师和学生在内近200人到场聆听。会议由广东省图象图形学会理事长金连文教授、副秘书长于仕琪教授、副理事长徐勇教授、副理事长兼秘书长郑伟诗教授、常务理事邹月娴教授共同主持。
图1 广东省图象图形学会理事长金连文教授主持会议
会议由理事长金连文教授致开幕辞。金连文教授在发言中肯定了粤港澳图象图形学术会在加强学术交流和提升广东省图象图形学会影响力过程中体现的积极作用,并鼓励该会议为省学会的发展做出更大贡献。
在接下来的学术报告环节,本次会议邀请了香港理工大学视觉计算陈长汶教授、哈工大(深圳)计算与智能研究院院长张民教授、深圳北理莫斯科大学黄继武教授、中国科学院自动化所研究员李国齐、上海人工智能实验室乔宇教授、清华大学计算机系刘知远教授做主旨报告。香港科技大学计算机科学与工程系和化学与生物工程系陈浩教授、澳门科技大学计算机科学与工程学院蔡占川教授、香港大学电气与电子工程系的齐晓娟教授、香港中文大学(深圳)数据科学学院吴保元教授做特邀报告。上述嘉宾分别进行了题为《从现代视觉计算的角度探讨6G语义通信》、《以语言为核心的多模态大模型和人工智能探索》、《图像篡改定位—AI算法的对抗》、《类脑脉冲通用智能大模型》、《通用多模态大模型:进展与趋势》、《大模型知识密度定律》、《大模型赋能智慧医疗:挑战和未来》、《嫦娥工程图形图像智能计算与思考》、 《Learning to Simulate and Understand the 3D Visual World》、《可解释的深度伪造检测进展》的学术报告报告。
图2 第十四届粤港澳图象图形学术会议现场
在《从现代视觉计算的角度探讨6G语义通信》的报告中,陈长汶教授展示了当前大模型及生成式人工智能技术遇到的挑战,以及视觉计算和语义通信对未来技术革命所产生的影响。
图3 香港理工大学视觉计算陈长汶教授做主旨报告
在《以语言为核心的多模态大模型和人工智能探索》的报告中,张民教授分享了对语言大模型、以语言为核心的多模态大模型以及人工智能的一些观点,并介绍哈工大(深圳)最近的一些相关工作,包括自主可控立知大语言模型、以语言为核心的多模态大模型、大模型驱动的智能体应用以及对多智能体协作机制的初步探索。
图4 哈工大(深圳)计算与智能研究院院长张民教授做主旨报告
在《图像篡改定位—AI算法的对抗》的报告中,黄继武教授指出围绕图像篡改定位任务,介绍了篡改定位的实现、围绕篡改定位任务的AI算法攻防。最后,讨论了这一领域所面临的挑战。
图5 深圳北理莫斯科大学教授黄继武教授做主旨报告
在《类脑脉冲通用智能大模型》的报告中,李国齐老师认为当前智能算力的功耗问题,迫切需要研究新型低功耗智能计算系统,类脑架构被认为是低功耗计算重要途径。本报告从研究背景出发,首先介绍类脑智能概念和定义,然后结合报告人的研究进展阐述当前阶段做脉冲类脑大模型关键科学技术问题,以及为什么其可能成为一个有潜力的研究方向。
图6 中国科学院自动化所李国齐研究员做主旨报告
在《通用多模态大模型:进展与趋势》的报告中,乔宇教授介绍了通用多模态大模型的最新进展,重点聚焦于上海人工智能实验室打造的“书生”通用大模型体系,并深入分析了未来的发展趋势。
图7 上海人工智能实验室教授乔宇教授做主旨报告
在《大模型知识密度定律》的报告中,刘知远教授探讨了过去大模型在印证规模法则的同时,还呈现知识密度持续增强的规律,可称为大模型知识密度定律。刘知远教认为面向未来,更应从模型架构、成长算法和数据治理等方面不断改进模型制造工艺,提升模型制程,保证大模型知识密度定律的可持续,揭示端侧智能的巨大潜力。
图8 清华大学计算机系长聘刘知远教授做主旨报告
在《大模型赋能智慧医疗:挑战和未来》的报告中,陈浩教授专注于大模型驱动的人工智能技术在医疗领域的前沿研究与转化应用,展示了研究团队利用大模型在临床医疗领域的落地应用实例。
图9 香港科技大学计算机科学与工程系和化学与生物工程系陈浩教授做特邀报告
在《嫦娥工程图形图像智能计算与思考》的报告中,蔡占川教授回顾了中国探月计划的历史背景及其发展里程,介绍了从嫦娥一号到嫦娥五号的技术演进,并系统阐述了中国探月“三步走”战略的科学基础与实施路径,深度分享了“月球表面高程模型”的最新研究进展,展示了嫦娥三号月球车的图像拼接技术,并对月球及火星撞击坑检测的传统与现代技术方法进行了对比分析。
图10 澳门科技大学计算机科学与工程学院蔡占川教授做特邀报告
在《Learning to Simulate and Understand the 3D Visual World》的报告中,齐晓娟教授讨论了在通过重建,分解和生成创建3D交互环境方面的研究工作,如何通过采用以数据为中心的方法,使机器具备在3D环境中理解和推理的能力。
图11 香港大学电气与电子工程系齐晓娟教授做特邀报告
在《可解释的深度伪造检测进展》的报告中,吴保元教授围绕生成式人工智能技术而产生的深度伪造(DeepFake)检测进行了介绍。传统的检测方法虽然能够判断内容真假,但往往缺乏解释性,导致模型在实际应用中的可信度不足。为了充分发挥多模态大模型在DeepFake检测中的潜力,介绍了其团队在深度伪造检测方面的最新工作。
图12 香港中文大学(深圳)数据科学学院吴保元教授做特邀报告
图13 第十四届粤港澳图象图形学术会议会场一览
在特邀嘉宾报告之后,到场嘉宾与专家学者、各大高校师生和各企业界人士进行了广泛而深入的交流,大会在全体参会者热烈的掌声中圆满结束。
—————————————————————————————————————————————————————————————
2024年12月22日,广东省图象图形学会在同一地点举办了AAAI 2025预讲会议,邀请了12篇被人工智能顶会AAAI 2025录用的论文作者做分享报告。该分享报告会由南方科技大学于仕琪教授、中山大学李冠彬教授和中山大学郭裕兰教授共同主持。
图14 南方科技大学于仕琪教授、中山大学李冠彬教授和中山大学郭裕兰教授主持会
来自华南理工大学的杨振华同学做了题目为“Predicting the Original Appearance of Damaged Historical Documents”(损坏古籍文档的原貌重建)的论文分享报告指导老师为华南理工大学金连文教授。
图15 华南理工大学杨振华同学作分享
来自中山大学的余泽钦同学做了题目为“Reinforced Multi-teacher Knowledge Distillation for Efficient General Image Forgery Detection and Localization”(基于强化学习的多教师知识蒸馏用于高效的通用图像篡改检测与定位)的论文分享报告,指导老师为中山大学倪江群教授。
图16 中山大学余泽钦同学作分享
来自深圳大学的林凯清同学做了题目为“Standing on the Shoulders of Giants: Reprogramming Visual-Language Model for General Deepfake Detection”(站在巨人的肩膀上:视觉语言模型重编程下的通用深度伪造检测)的论文分享报告,指导老师为李斌教授。
图17 深圳大学林凯清同学作分享
来自哈尔滨工业大学(深圳)的王俊杰同学做了题目为“OV-DQUO: Open-Vocabulary DETR with Denoising Text Query Training and Open-World Unknown Objects Super-vision”(OV-DQUO:基于去噪文本查询训练和开放世界未知对象监督的开放词汇DETR)的论文分享报告,指导老师为陈斌教授。
图18 哈尔滨工业大学(深圳)王俊杰同学作分享
来自南方科技大学的汪超同学做了题目为“SpikingSSMs: Learning Long Sequences with Sparse and Parallel Spiking State Space Models ”(SpikingSSMs:使用稀疏并行脉冲状态空间模型建模长序列)的论文分享报告,指导老师为张建国教授和冷卢子未教授。
图19 南方科技大学汪超同学作分享
来自香港中文大学(深圳)的杨奕铭同学做了题目为“Topo2Seq: Enhanced Topology Reasoning via Topology Sequence Learning ”(Topo2Seq:通过拓扑序列学习增强拓扑推理)的论文分享报告,指导老师为李镇教授。
图20 香港中文大学(深圳)杨奕铭同学作分享
来自南方科技大学的金冬阳同学做了题目为“Exploring More from Multiple Gait Modalities for Human Identification ”(多模态步态特征在人体识别中的深入探索)的论文分享报告,指导老师为于仕琪教授。
图21 南方科技大学金冬阳同学作分享
来自深圳北理莫斯科大学的卢海锋同学做了题目为“Understanding Emotional Body Expressions via Large Language Models”(基于大语言模型的肢体语言理解)的论文分享报告,指导老师为谭明奎教授和胡希平教授。
图22 深圳北理莫斯科大学卢海锋同学作分享
来自中山大学的王本烽同学做了题目为“Federated Weakly Supervised Video Anomaly Detection with Multimodal Prompt”(基于多模态提示的联邦弱监督视频异常检测)的论文分享报告,指导老师为黄超和徐勇教授。
图23 中山大学王本烽同学作分享
来自华南理工大学的王煜骁同学做了题目为“Precision-Enhanced Human-Object Contact Detection via Depth-Aware Perspective Interaction and Object Texture Restoration ”(基于深度感知视角交互和物体纹理的高精度人物接触检测)的论文分享报告,指导老师为刘琦教授。
图24 华南理工大学王煜骁同学作分享
来自深圳大学的冼晓乐同学做了题目为“CA-Edit: Causality-Aware Condition Adapter for High-Fidelity Local Facial Attribute Editing ”(基于上下文因果建模的高保真度局部人脸编辑)的论文分享报告,指导老师为解为成和沈琳琳教授。
图25 深圳大学冼晓乐同学作分享
来自清华大学深圳国际研究生院的胡瑨桐同学做了题目为“GaussianSR: High Fidelity 2D Gaussian Splatting for Arbitrary Scale Image Super-Resolution ”(GaussianSR:用于任意尺度图像超分辨率的高保真二维高斯溅射)的论文分享报告,指导老师为杨文明教授。
图26 清华大学深圳国际研究生院胡瑨桐同学作分享
图27 参加AAAI 2025录用论文分享会的部分与会师生合影
最后,本次AAAI论文分享会在热烈的讨论和对明年第十五届粤港澳图象图形学术会议的期待中圆满结束。感谢本次会议的所有组委会人员和志愿者人员的辛勤付出。以下仅列出组委会人员名单以表感谢。
大会主席:
● 金连文,华南理工大学
● 于仕琪,南方科技大学
● 徐 勇,哈尔滨工业大学(深圳)
● 操晓春,中山大学
● 聂礼强,哈尔滨工业大学(深圳)
程序委员会主席:
● 谢晓华,中山大学
● 张 鑫,华南理工大学
组织委员会主席:
● 谭明奎,华南理工大学
● 范 衠,电子科技大学(深圳)
● 曾 丹,中山大学
赞助主席:
● 王 东,深圳职业技术大学
● 杨金锋,深圳职业技术大学
● 邹月娴,北京大学深圳研究生院
宣传主席:
● 崔金荣,华南农业大学
● 康文雄,华南理工大学
● 彭涵阳,鹏城实验室
财务主席:
● 林上港,华南农业大学
技术支持主席:
● 陈昌盛,深圳大学
注册主席:
● 沈川福,电子科技大学(深圳)高等研究院
Copyright © 2024 广东省图象图形学会
地址:广东省广州市五山路381号华南理工大学逸夫科学馆406I
邮编:510640
联系电话:18934029278