利用AI+大数据的方式分析恶意样本（四十六）

企业开发 2023-09-06 21:12:41 阅读次数: 0

From Grim Reality to Practical Solution: Malware Classification in Real-World Noise

西北大学，Xinyu Xing

恶意软件数据集由于样本标记所需的专业知识和经验的短缺，不可避免地包含了错误的标签。

先前的研究表明，训练集中存在错误标记的样本将导致模型学习的不准确。为解决这个问题，研究人员提出了各种噪声学习方法来抵消错误标记样本的影响，在图像识别和文本挖掘等应用中，这些方法表现出了很好的效果。

在这项工作中，我们将代表性和最先进的噪声学习方法应用于现实世界的恶意软件分类任务。令人惊讶的是，我们观察到现有方法都不能最小化错误标签的影响。

通过精心设计的实验，我们发现这种无效主要是由于极端的数据不平衡和高比例的错误标记数据样本导致的。因此，我们进一步提出了一种新的噪声学习方法，并将其命名为MORSE。

与现有方法不同，MORSE定制并扩展了最先进的半监督学习技术。它将可能存在错误标记的数据视为未标记数据，从而避免它们对模型学习的潜在负面影响。

在MORSE中，我们还整合了样本重新加权方法，平衡模型学习中的训练数据使用，从而解决了数据不平衡的挑战。我们在合成和真实的数据集上评估了MORSE。结果表明，MORSE能够显著优于现有的噪声学习方法，并最小化错误标记数据的影响。

文章结构

intro
summary of existing methods
e

猜你喜欢

转载自blog.csdn.net/AcSuccess/article/details/132122694

利用AI+大数据的方式分析恶意样本（四十六）

利用AI+大数据的方式分析恶意样本（十三）

利用AI+大数据的方式分析恶意样本（十一）

利用AI+大数据的方式分析恶意样本（五）

AI+游戏：高效利用样本的强化学习 | 腾讯AI Lab学术论坛演讲

CVE-2017-11882漏洞利用恶意样本分析

AI+大数据的四个突破点

鸿蒙源码分析（四十六）

大数据Doris（四十六）：物化视图查询改写和适用场景

Sight推出产品Olo，利用AI分析血液样本

[系统安全] 四十六.恶意软件分析 (2)静态分析Capa经典工具批量提取静态特征和ATT&CK技战术

打通物联网任督二脉,海天味业畅谈AI+大数据

AI+大数据助力抗疫，带你认识百度地图的新玩法！

启信宝CEO陈青山：AI+大数据驱动下的金融新生态

“AI+大数据+智能机器人”新型政企运营服务模式

新变种Emotet恶意样本分析

AI+数据分析：Stratifyd 挖掘数据价值，重塑保险客户体验

新冠全球蔓延，AI+大数据拿什么拯救全人类？ | AI 技术生态论

Android恶意样本数据集汇总

leetcode解题思路分析（四十六）395 - 401 题

澳大利亚通信公司失陷，被利用分发恶意样本

数据结构（四十六）基数排序

四十六：数据库之Flask-SQLAlchemy的使用

C语言之数据结构基本概览(四十六)

AI时代Python大数据分析

学习四十六

四十六、NIO详解

四十六——五十一

AI+互联网产品开发技能：数据分析、机器学习、深度学习、产品设计、产品运营

如何利用网络取证之流量分析的方式，还原恶意攻击入侵的全过程？

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)