概述:
此分享是基于本体实现网页规则分类的方法介绍
汇总点:
1.支持向量机( SVM) 、Rocchio算法、K近邻法( KNN)等这些分类方法需要根据训练语料得到各类别的模板,进而根据模板进行分类.
2.本体是一个实体,是把现实世界中的某个领域抽象为一组概念和概念之间的关系
3.html中的标签<title> <meta><h1><a>这些能代表web页面的特征
4.构建父学科规则,学科规则,基于规则对web页面进行分类
备注:
难点是规则的建立
更多信息参见附件
概述:
此分享是基于本体实现网页规则分类的方法介绍
汇总点:
1.支持向量机( SVM) 、Rocchio算法、K近邻法( KNN)等这些分类方法需要根据训练语料得到各类别的模板,进而根据模板进行分类.
2.本体是一个实体,是把现实世界中的某个领域抽象为一组概念和概念之间的关系
3.html中的标签<title> <meta><h1><a>这些能代表web页面的特征
4.构建父学科规则,学科规则,基于规则对web页面进行分类
备注:
难点是规则的建立
更多信息参见附件