贵大新闻网讯(大数据与信息工程学院) 近日,我校大数据与信息工程学院2021级信息管理与信息系统专业本科生谢武林以第一作者身份投稿的学术论文 UPDGD-Net: An Uncertainty-aware Pseudo-labeling and Dual Graph Driven Network for Incomplete Multi-view Multi-label Classification 被人工智能与多媒体领域国际顶级会议ACM MM 2024收录。
ACM MM全称为ACM国际多媒体会议(ACM International Conference on Multimedia),由美国计算机协会(ACM)主办,是全球多媒体领域最具影响力的国际顶级学术会议之一,享有很高的国际学术声誉。在中国计算机学会(CCF)推荐的国际学术会议中,ACM MM为多媒体与人工智能领域的A类会议;在谷歌学术公布的最新学术出版物影响力榜单中,ACM MM在多媒体及相关领域的所有学术出版物中h5-index为 101。
谢武林的主要研究方向包括多视图学习、多标签分类与机器学习。他表示,此次论文取得的成绩,要感谢学校提供的良好环境和资源,感谢大数据与信息工程学院卢晓寰老师的悉心指导和同学们的鼓励支持。从研究工作的开展到论文写作的打磨,不仅提升了他的学术能力,更培养了他的毅力和独立思考能力,深刻体会到学术研究的严谨性和重要性。他将以此为新起点,继续努力,在学术道路上不断探索前行。
延伸阅读:
随着数据获取技术的发展,来自不同来源的多视图数据能够提供更细致和多样化的对象表示。例如,一幅图像可以用SIFT、Gist和HSV等多种不同的特征提取方法来表示。因此,多视图学习已成为数据分析领域的重要方法,许多相关工作基于子空间学习和矩阵分解提出了多种方法。
另一方面,作为经典的分类问题,多标签分类(MLC)长期以来在模式识别领域中占据重要地位。与要求标签之间互斥的单标签数据不同,多标签数据包含多个类别标签,并自然地保持复杂的标签相关性。例如,一张图片可能包含“霓虹灯招牌”“人行道”和“行驶车辆”等多个元素,每个元素都有助于对场景的更全面理解。然而,传统的多标签分类方法主要依赖于单一视角提取的特征,限制了其性能。通过将多视图学习整合到多标签分类中,可以有效缓解这一限制。因此,复合多视图多标签分类(MvMLC)应运而生,并吸引了越来越多研究者的关注。
然而,MvMLC面临的一个重大挑战是数据的不完整性,既包括视图的不完整也包括标签的不完整。这一挑战直接导致了不完整多视图多标签分类(iMvMLC)的必要性,该任务关注于在某些视图或标签缺失的情况下进行分类。为了解决这一问题,该篇文章提出了一种不确定性感知的伪标签生成与双图驱动网络(UPDGD-Net)。不同于现有方法,UPDGD-Net通过不确定性感知的伪标签生成策略填补缺失标签,并利用填补后的标签矩阵对模型提取的高维特征施加双图约束,从而保持原始数据的内在结构。此外,该文设计了两个基于Transformer的模块,分别用于跨视图聚合和多标签分类,并在跨视图聚合模块中应用了平均视图标记(AVT),以更好地学习多视图之间的一致信息。实验结果表明,UPDGD-Net在五个数据集上的表现优于其他最先进的方法,验证了其有效性。
编辑:张蝉
责编:李旭锋
编审:丁龙