分类器学习
规律总结:
1.以n、ch结尾的倾向于男性
2.以yn、h结尾的倾向于女性
from nltk import *
函数名称 | 解释 |
---|---|
gender_feature = {feature_name:feature_value} tarin_set = [({feature_name:feature_value},tag)] classifier = NaiveBayesClassifier.train(train_set) classifier.classify() classifier.show_most_informative_features(n) |
朴素贝叶斯分类器 (首先构建一个特征提取器gender_feature) 分类 展示前n个对分类最有效的特征 |
from nltk.classify import *
函数名称 | 解释 |
---|---|
accuracy(classifier,test_set) |
评估分类准确率 |
apply_features(gender_feature,train_set) | 返回一个类似于List但不会在内存中存储所有特征集的对象 |