我校首次在计算机视觉领域顶级会议ICCV上发表论文

10月2日至6日，计算机视觉领域顶级会议IEEE/CVF International Conference on Computer Vision(ICCV)在法国巴黎召开。我校信息工程学院智能媒体处理团队教师宁纪锋和王振华分别在会上发表题为“LoTE-Animal: A Long Time-span Dataset for Endangered Animal Behavior Understanding”和“CTVIS: Consistent Training for Online Video Instance Segmentation”的两个视频分析与理解方面的研究成果。在这两个工作中，发布了一个大型珍稀野生动物数据集LoTE-Animal和提出视频实例分割模型的一致性训练方法。据悉，这是我校首次在ICCV上发表论文。

第一篇论文是一个濒危野生动物数据集，由我校联合西华师范大学，北京师范大学等5家高校和研究单位发表，我校博士生刘丹、北京师范大学侯金和腾讯AI Lab黄少立博士为共同一作，我校宁纪锋教授、西华师范大学郑伯川教授和张晋东教授为联合通讯作者。本文首次构建了一个大型濒危动物数据集LoTE-Animal，该数据集来自我国四川卧龙和马边国家级自然保护区中架设的二百余个红外触发陷阱相机，图像包括大熊猫、小熊猫、川金丝猴、藏酋猴、岩羊、中华鬣羚等11种濒危动物以及丰富多样的生态季节、天气条件、时期、视点和栖息地场景，收集历时长达12年。该数据集由用于动作识别任务的10000多个视频序列和用于目标检测、实例分割和姿态估计任务的28000幅图像构成。本文提供了具有代表性的视觉理解方法和跨领域实验的评估结果，并开源了数据集，以促进人工智能在珍稀物种行为理解及其保护中的应用。

LoTE-Animal野生动物数据集示例

第二篇论文提出了在线视频实例分割的一致性学习方法，由我校和浙江大学、浙江工业大学、澳大利亚阿德雷德大学、英国斯旺西大学等5家高校联合发表，我校王振华副教授和浙江大学陈昊研究员为联合通讯作者。本文提出了一种称为CTVIS的模型训练方法，通过将视频实例分割模型训练的对比项集构建与推理对齐，实现当前帧实例特征和历史帧实例特征的高可靠性比对，从而使所训练的模型在处理诸如目标间遮挡、目标消失后重现、目标形变等挑战时更加稳健。所提方法期望用于促进视频监控、视频编辑、增强现实和自动驾驶等实际应用发展。

一致性视频实例分割方法框架

ICCV是计算机视觉领域的三大顶级会议之一，也是中国计算机学会（CCF）推荐的人工智能方向的A类会议，在全球计算机视觉领域有着很强的学术影响力。

论文1链接：https://openaccess.thecvf.com/content/ICCV2023/html/Liu_LoTE-Animal_A_Long_Time-span_Dataset_for_Endangered_Animal_Behavior_Understanding_ICCV_2023_paper.html

论文2链接：https://openaccess.thecvf.com/content/ICCV2023/html/Ying_CTVIS_Consistent_Training_for_Online_Video_Instance_Segmentation_ICCV_2023_paper.html

编辑：张晴

终审：徐海

我校首次在计算机视觉领域顶级会议ICCV上发表论文

图说

视频

最新新闻