数据标注


有监督学习需要大量标注样本,而加密流量标注需要专家经验,不仅成本高而且耗时。利用主动学习选择有价值的"困难样本"进行标注,从而 显著减少样本标注数量和训练数据。

传统主动学习选择困难样本粒度较粗,设计一种新型多委员模型困难样本度量策略,提升困难样本选择质量。

论文

  • 郭昊, 张岩峰, 刘智. 一种融合聚类与不确定性的恶意加密流量识别方法. 计算机应用与软件(已录用)
  • 张荣华,刘智,罗琴.一种基于QBC不一致性的恶意加密流量识别方法[J].电子测量技术,2022,45(01):28-34.
  • 罗琴, 杨根, 刘智, 唐宾徽. 结合主动学习的威胁情报IOC识别方法. 电子科技大学学报, 2023, 52(1): 108-115
  • Wenli Zeng, Zhi Liu, Yaru Yang, Gen Yang and Qin Luo, QBC Inconsistency-Based Threat Intelligence IOC Recognition. IEEE Access, vol. 9, pp. 153102-153107, 2021