您所在的位置: 首页 - 新闻焦点

我校学子首次在计算机多媒体领域顶级会议上做报告

近日,第29届多媒体领域顶级会议ACM Conference on Multimedia在成都召开,我校信息学院研究生胡磊在会议上发表题为“Do We Really Need Frame-by-Frame Annotation Datasets for object tracking?”的视频跟踪研究论文,并做线上报告。该论文第一作者为我校硕士研究生胡磊,澳大利亚悉尼大学黄少立博士为共同第一作者,信息学院宁纪锋教授为通讯作者,这是我校以第一单位在中国计算机学会(CCF)推荐A类国际会议上发表的第2篇高水平会议论文。

q_副本.png

硕士研究生胡磊线上汇报论文

最近跟踪领域的研究越来越重视构建大规模跟踪数据集,并将其作为基于深度学习的跟踪器成功的驱动因素。然而,高强度与准确标注跟踪数据限制了其在实际中的应用,论文首次探索了在小规模数据集上训练高性能跟踪算法的可行性。通过引入了一个FAT基准从现有跟踪数据集中对每个视频采样一帧或几帧来构造,用于评估跟踪算法的有效性,并提出了模拟运动变化的数据增强策略,使小规模数据集学习高性能跟踪器具有可行性。论文使用FAT数据集在两个代表性跟踪器上评估了跟踪算法的性能,实验结果表明,利用提出方法,跟踪器仅在少量标注数据集上训练即可达到与大规模全标注数据集相当甚至更好的性能。

ACM是世界上最大的计算机领域专业性学术组织,而ACM Multimedia是公认的多媒体技术领域顶会(CCF推荐国际A类会议),根据CCF分类标准,A类会议指国际上极少数的顶级学术会议,鼓励我国学者去突破。ACM Multimedia自1993年以来每年举办一次,迄今为止已经举办了29届,大会致力于推动多媒体的研究和应用,是人工智能多模态研究领域的顶级国际学术会议。

论文与报告视频链接:https://dl.acm.org/doi/10.1145/3474085.3475365


编辑:张晴

终审:徐海