近期,计算机工程学院人工智能及应用团队冯宇健博士和张俐博士先后在模式识别和群体智能计算领域国际著名期刊《Pattern Recognition》(中科院一区TOP期刊,影响因子7.5)和《Swarm and Evolutionary Computation》(中科院一区期刊,影响因子8.2)上发表题为“Learning multi-granularity representation with transformer for visible-infrared person re-identification”和“Elite-driven grey wolf optimization for global optimization and its application to feature selection”的研究论文。两篇论文均以江苏理工学院为第一单位,分别以冯宇健博士和张俐博士为第一作者。
可见红外行人重识别(VI-ReID) 旨在匹配可见光和近红外模态的行人图像。两种模态的行人图像包含不同大小和位置的判别性特征,例如衣服的全局颜色、身体的局部姿势和鞋子的像素大小。现有的方法主要捕捉单一粒度的特征,忽略了有助于行人识别的多粒度信息。冯宇健博士提出了一种跨模态多粒度Transformer(CM2GT)框架,设计了一个基于Transformer的多粒度特征提取器(MGFE)模块和多粒度融合Transformer(MGFT)模块,分别用于捕获每个模态的全局块像素级特征和挖掘多粒度特征之间的层次关系,实现了多个尺度语义信息的灵活表示和不同粒度和模态之间身份显著性的一致性。同时,通过设计一个跨模态最近邻聚类(CNC)损失函数,最小化锚样本与其跨模态最近邻之间的距离,进一步增强潜在空间中的跨模态类内聚类。实验结果表明,该识别方法相比现有的方法,具有一定的优势性。
该成果是冯博士来我院后在该领域顶刊PR上发表的第二篇论文。论文DOI: 10.1016/j.patcog.2025.111510。
灰狼优化算法(GWO)因其在数据预处理中简单高效而备受关注,但在处理复杂的特征选择问题时容易陷入局部最优,限制其应用潜力。为解决这一问题,张俐博士提出精英驱动灰狼优化算法(EDGWO)。该算法利用灰狼种群的社会层次结构,设计了三种全局探索算子,显著提高Alpha、Beta和Delta灰狼的全局搜索能力。实验结果表明:与现有的15种著名算法相比,EDGWO算法收敛速度快,能有效规避局部最优,并在癌症微阵列数据集的特征选择中保持较高的收敛速度和准确率。论文DOI: 10.1016/j.swevo.2024.101795。
张俐博士近三年来已经在该领域的多个知名期刊上连续发表了5篇高质量的论文。(文/图:冯宇健、张俐、吴旭;审核:史培中)