版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_34611224/article/details/56668735
考虑三个问题:
如何使用机器学习的算法对做好特征的网络流量进行异常识别?
用什么语言?
用什么工具或者软件?
Weka简介
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档(doc文件夹)。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
回答了第一个和第三个问题。
可参考Weka使用教程,翻译的官方的
使用语言
推荐的就是Java,也是weka的开发语言。源代码:http://www.cs.waikato.ac.nz/ml/weka/
机器学习的算法在weka提供的API中都可以找到,仔细阅读就可以加以利用。当然,最简单的方式要属weka人性化的界面,直接按钮就可以了,但是很显然,做一个系统如何才可以体现工作量?不是点几下出来结果就好了。
回答了第二个问题。
语言、工具介绍完了,再加上前面提到的数据集,开始系统的构建。