我院5篇论文被计算机多媒体领域国际顶级会议录用

 

近日,国际顶级会议ACM Multimedia2018公布录用结果,我院纪荣嵘教授、王菡子教授、丁兴号教授3个课题组共有5篇论文入选,在国内高校名列前茅。ACM Multimedia是计算机学科多媒体领域的顶级会议,被中国计算机学会(CCF)列为A类会议。与其他理工科学科不同,在全国学科评估中,唯有“计算机科学与技术”一级学科将CCF推荐的A类国际会议计入成果评估。ACM Multimedia有着严苛的录用标准,2018年的有效投稿量达757篇,口头宣读论文录取率不到8.5%,张贴论文录取率约为19%。本年度厦门大学信息学院一次性在ACM Multimedia上发表长文5篇,标志着我院“一流学科”的研究成果得到了国际同行的认可。这次被录用的这5篇论文的相关信息如下:

题目:Robust correlation filter tracking with shepherded instance-aware proposals (作者:Yanjie Liang, Qiangqiang Wu, Yi Liu, Yan Yan, Hanzi Wang*). 本文第一作者是厦门大学计算机科学系2016级博士研究生梁艳杰,通讯作者是其导师王菡子教授。

该论文被录用为口头宣读,论文提出一种基于实例感知目标建议窗口的鲁棒相关滤波跟踪方法。近年来,基于CNN的相关滤波跟踪方法由于其较高的精度受到了广泛的关注,但它不能有效地处理目标的尺度变化以及重检测问题。本文充分利用目标建议窗口在尺度估计以及重检测方面的优势,首先,基于与目标实例集的表观相似度以及空间约束对目标建议窗口进行有效排序,生成实例感知目标建议窗口;然后,基于CNN的相关滤波模型对这些实例感知目标建议窗口进行位置优化;最后,将优化后的实例感知目标建议窗口有效融入到基于CNN的相关滤波跟踪框架之中实现跟踪。本文提出的方法能够显著提高算法在尺度估计、快速运动、背景干扰、遮挡形变等方面的鲁棒性,在OTB100和UAV20L数据集上取得优异的性能,特别适用于长程跟踪场景。

题目:Dense auto-encoder hashing for robust cross-modality retrieval(Hong Liu, Mingbao Lin, Shengchuan Zhang, Yongjian Wu, Feiyue Huang, Rongrong Ji*)。本文第一作者刘弘是厦门大学智能科学与技术系2016级博士研究生,通讯作者是其导师纪荣嵘教授).

本文提出了一种模态缺失情况下的快速哈希检索算法。近年来跨模态(文本、图像、视频、音频等)哈希检索技术得到了广泛的关注,但普遍考虑的都是模态完整情况下的训练方式,而实际应用中更多的是存在大量模态缺失的情况。本文考虑了模态部分缺失的状态下(文本模态和图片模态)进行鲁棒性二值化编码的学习,论文首先提出了Dense Auto-encoder Network研究不同模态间的关联性,进行缺失模态补全的完整性学习,同时引入变纷哈希技术,利用局部敏感哈希对数据的label进行二值化编码,引导哈希函数的学习,将各个模态的二值化编码映射到一个共同空间中。该方法能够做到在某种模态100%缺失的情况下依旧能够学习到具有鲁邦的哈希特征。所提方法在各个数据集上的验证结果表明该算法明显优于其他方法。

题目:Supervised online hashing via Hadamard codebook learning (作者:Mingbao Lin, Rongrong Ji*, Hong Liu, Yongjian Wu)。本文第一作者是厦门大学智能科学与技术系2016级硕士研究生林明宝,通讯作者是其导师纪荣嵘教授。

该论文提出了一种在线哈希学习技术。对于具有时序性的数据,哈希模型需要随着新数据的获得而进行动态的更新同时保留以往数据的特征分布,且对模型更新的时间又具有很高的要求。本文利用Hadamard矩阵,将每一个类别分别随机给予一个Hadamard编码,采用LSH方法将其进一步映射到所需的比特位空间,学习更为鲁棒性的哈希编码机制。相对于已有的方法,本文提出的方案能够使得数据类别可以动态的增加,通过实验证明,本方案每次只需要一个样例即可进行哈希函数的动态更新,而以往的方法往往需要一对带有相似性标注信息的数据,或者需要收集到一定量的数据,才能进行哈希哈数的更新。在公开的三个数据集上测试表明,所提方法在时间和性能上都取得了不错的性能表现。该论文获得了Oral Presentation的优异结果。

题目:PVNet: A joint convolutional network of point cloud and multi-view for 3D shape recognition(作者:Haoxuan You, Yifan Feng, Rongrong Ji*, Yue Gao)。本文第一作者是厦门大学智能科学系2018级硕士推免生丰一帆,通讯作者是其导师纪荣嵘教授。

近年来,3D物体的识别广泛地吸引了多媒体及计算机视觉领域的注意力。深度学习模型在各种领域中发挥着巨大的作用。其中基于点云或多视图的3D表示的方法用于深度学习模型中在识别任务中有着显著的效果。但是目前并没有将这两者合在一起去做3D识别的网络,这两种表示的数据是可以互补的。在这篇文章中作者提出了点云-多视图网络,第一个将点云和多视图结合在一起去做3D的识别。同时作者也提出了一种嵌入注意力融合机制,该方案可以从多视图数据中使用高层特征来从点云数据建模不同结构特征的内在相关性和可辨别性。最终,这种可辨别的描述符被作为软注意力掩模来进一步细化3D形状的结构特征。所提的方法在Modelnet40数据库上的分类和检索实验结果都明显优于其他方法。

题目:Residual-guide feature fusion network for single image deraining(作者:Zhiwen Fan, Huafeng Wu, Xueyang Fu, Yue Huang, Xinghao Ding*). 本文第一作者是厦门大学通信工程系2016级硕士研究生樊志文,通讯作者是其导师丁兴号教授。

近年来,图像去雨任务广泛吸引计算机视觉领域的注意力。目前以深度学习为主流的单幅图像去雨模型存在复杂度较高并且没有考虑雨线稀密程度的问题。本文提出了一种基于残差引导的特征融合轻量化图像去雨深度学习模型。该模型包含多个去雨子模块,可以渐近学习出清晰的雨线。相对于已有的方法,本文提出的残差引导方案可以视为一种基于注意力机制的浅层与深层特征相融合方案,该方案使得深层模块可以有效抑制不相关的图像背景,提高学习过程的速度和雨线估计的精度。相关公开数据集上的仿真与真实数据实验表明本文所提方法具有明显的优势,且该模型可以拓展至去噪等图像处理任务。

 

您正在使用低版本的浏览器(低于IE6)!
为了获得正确的显示效果,请使用Firefox或Google Chrome等标准浏览器,
或升级您的浏览器至IE 8.0!