资讯中心

走进高校系列报告会第133期成功举办

       2023年11月5日上午,由中国计算机学会计算机视觉专委会(CCF-CV)主办、武汉大学计算机学院、武汉数学与智能研究院、武汉大学人工智能研究院承办的走进高校系列报告会第133期在武汉大学计算机学院成功举办。本次活动邀请了大连理工大学卢湖川教授、山西大学钱宇华教授、同济大学何良华教授、国防科技大学刘新旺教授、同济大学史淼晶教授、小米公司张帆研究员做特邀报告,由武汉大学计算机学院杜博教授和武宇教授担任本次活动的执行主席。在本次报告会上,专家们围绕“视觉基础模型和多模态感知前沿技术”主题进行了精彩的报告。会议吸引了多所高校的知名专家学者和青年学者,共计有100余名代表参加。

图片1.png 

   杜博院长发表欢迎词

       会议伊始武汉大学计算机学院院长杜博教授发表了欢迎词,代表学院对各位专家和与会师生的参会表示热烈的欢迎和衷心的感谢,他表示希望通过各位专家的精彩报告和深入讨论,为计算机视觉的基础研究和多模态技术的前沿应用提供重要的指导和启发。

01

报告信息

图片2.png 

 卢湖川教授主题报告

卢湖川教授以“一网通吃V2: 视觉通用小模型”为题,从视觉的通用表征学习和任务架构统一两个方面介绍了目前通用视觉模型的最新研究进展,同时介绍了团队的视觉通用小模型,Unicorn和UniNext在四个视频跟踪任务(SOT、MOT、VOS、MOTS)与十个实例级感知任务(Object Detection、Instance Segmentation、REC、RES、SOT、MOT、MOTS、VIS、SVOS、RVOS)上的大一统,实现视觉模型一网通吃。

 图片3.png 

 钱宇华教授主题报告

钱宇华教授的报告题目是“随机一致性视角下的机器学习理论与方法”。 在基于机器学习进行决策时,由于受到数据噪音、标注偏好等复杂因素影响,或由于缺乏足够证据和先验知识,决策结果与真实情况由于随机产生的一致性时有发生。报告重点介绍了如何重构具有原理可解释性的可学习理论,并在总结归纳机器学习可解释性研究的基础上,介绍了近年来针对该问题进行的一些尝试性探索。

 图片4.png

 何良华教授主题报告

何良华教授的报告题目是“小样本图像的迁移学习”,从迁移学习类型、特点及经典基础算法介绍出发,详细介绍了域适应下的度量学习、任务迁移下的对比学习等一系列前沿工作,并在会后讨论中探讨大模型时代下如何做迁移学校和小样本自适应学习。

 图片5.png 

 刘新旺教授主题报告

刘新旺教授的报告题目是“新型鲁棒多核聚类算法”,介绍了课题组最近提出的SimpleMKKM融合聚类框架及其相关拓展,该模型在不同应用中展示了优越的聚类性能,且不含任何超参数。同时,报告介绍了一系列改良的相关算法,如Localized SimpleMKKM算法和无参的样本自适应Localized SimpleMKKM算法等。

图片6.png 

史淼晶教授主题报告

史淼晶教授以视觉语言大模型及其在医学图像的应用”为题,首先介绍视觉语言大模型的兴起,而后介绍了两个相关工作,分别是运用视觉语言大模型进行自然图像的开集物体检测和医学图像的手术器械分割。前一个工作的重点在于设计可学习的检测提示词模块,后一个工作则聚焦基于文本提示词的分割框架设计。

 图片7.png

 张帆研究员主题报告

张帆研究员以“大模型在小爱同学中的应用”为题,介绍了小爱同学近期在多模态大模型落地和应用上的一系列工作,包括如何基于开源大模型搭建中文增强模型,多任务联合微调以及特定任务强化的统一框架;以及基于向量检索的大模型多模态交互框架;最后介绍了利用INT4/INT8量化与指令压缩等方式,提高大模型服务性能。

       参加本次活动的老师和同学认真聆听了报告,并与报告嘉宾进行了交流互动。

互动环节

图片8.png 

图片9.png 

图片10.png  图片11.png

参会人员合影