5月28日下午,计算机学院在教1-110开展了主题为“跨模态视觉人工智能技术在安防中的应用研究”的学术讲座,吸引计算机学院160多名师生的积极参与。讲座由计算机学院院长助理叶丽萍主持。
讲座主讲嘉宾是王晓副教授,她是武汉科技大学计算机科学与技术学院副教授、硕士生导师、湖北省“楚天学子”以及 ICME 区域主席。研究方向为计算机视觉和监控视频分析。已在国内外核心期刊发表学术论文 30 余篇,并主持多项科研项目。同时她也是我校与武汉科技大学联合培养计划中我校2018级优秀学子韩星硕的硕士阶段的导师。

讲座伊始,王教授回顾了人工智能的发展历程和深度学习的一些常见算法。提出了视觉人工智能对于安防领域的重要意义。跨模态视觉人工智能技术是未来安防发展的重要方向之一。在安防工程领域,随着智能城市、物联网(IoT)和人工智能(AI)技术的发展,视频监控系统的应用将不断增加。截至2025年,全球摄像头的总数预计将达到数十亿个。跨模态视觉人工智能技术能够在不同模态的数据之间建立联系,充分挖掘数据的潜在信息,从而提高安防监控系统的准确性和可靠性。

王教授分享了他们团队在跨模态视觉人工智能技术在安防中的应用中的研究。讲座从构建数据集、目标检测、目标重识别、异常视频检测技术等方面展开。
1.有效构建数据集
构建高质量的数据集可以为安防领域中的算法训练和验证提供可靠的基础,确保模型能够学习到多样化的特征并具备良好的泛化能力。通过合理的数据集构建,能够为后续的算法训练和验证提供坚实的基础。王教授以构建夜间行人检测数据集为例,在不同光照条件下收集数据,并通过标注工具对数据进行精准标注,确保数据集能够真实反映实际应用场景并且防止漏检问题的出现。
2.目标检测
目标检测中的行人检测旨在精准识别图像或视频中行人位置,对安防监控、智能交通等领域的人员管理与行为分析至关重要;关键点检测则聚焦于定位行人肢体关节等关键部位,为更深入的人物姿态估计、动作识别及细粒度分析提供基础支撑。王教授对多种目标检测主流算法进行了深入的比较分析,包括不同算法在各种安防场景下的性能表现。通过对算法的优缺点进行详细阐述,帮助大家更好地了解选择合适的算法以满足实际需求。王教授展示了多个算法在相同数据集上的性能对比,包括 R-CNN、FilteredICF、DeepParts 等算法在 KITTI 数据集上的平均精度(AP)表现,详细分析了各自的优势和局限性。
3.目标重识别技术
在行人重识别环节,利用深度学习技术实现对特定目标的准确识别与追踪,对实现安防监控中的人员和车辆管理至关重要。王教授以行人重识别为例,介绍了通过深度学习模型提取行人的特征,并利用这些特征进行匹配和识别。同时,还探讨了跨模态目标重识别的挑战和解决方案,展示了在可见光和红外图像之间建立有效的特征匹配,提高目标识别的鲁棒性。
4.异常视频检测技术
异常视频检测通过智能分析视频内容,实时识别偏离正常模式的异常行为或事件,有效提升安防监控的智能化水平与预警能力。通过智能分析视频内容,识别异常行为,可以有效提升安防监控的智能化水平。王教授分享了团队最新的研究成果,展示了通过分析视频中的多源数据来准确检测异常事件。利用光流、姿态和相互作用属性等多源信息,结合深度学习模型,可以实现对异常行为的精准识别。同时,王教授还介绍了通过对场景文本和人物文本特征的全局对比,以及人物视觉特征的局部对比,实现对视频内容的多模态对比学习,提高异常检测的准确性。
最后,王教授着重分析了跨模态研究的重要性,并探讨了将红外和可见光等不同类型的数据结合。通过跨模态融合,能够充分发挥不同模态数据的优势,提高系统的智能响应能力。王教授以夜间行人为例,展示了如何通过跨红外和可见光模态的特征融合,提高行人检测的准确性和鲁棒性。同时,还介绍了跨模态伪装目标检测的研究进展,展示了如何利用深度信息引导机制和轮廓探索模块,实现对伪装目标的精准检测。
此次讲座为我校师生提供了与专家学者面对面交流的机会,激发了大家在视觉人工智能与安防领域的研究兴趣,也为我校人工智能专业的发展带来了新的思路与方向。讲座结束后,现场师生纷纷表示受益匪浅,并期待未来能有更多类似高水平的学术交流活动。
