1 请写出贝叶斯公式,请描述朴素贝叶斯分类方法的原理和步骤。
- 贝叶斯公式
朴素贝叶斯假设:
-特征之间相互独立(统计意义上,一个特征出现的可能性与其他特征没有关系,朴素的意义)
-各特征同等重要
P(Ci): 先验概率 P(Ci|**x**): 后验概率
-
素贝叶斯分类方法原理
依据给定的资料,统计各个特征在相应类别下的概率,通过比较相应类别的概率大小来实现分类。
-
朴素贝叶斯分类步骤
⑴收集数据:可以使用任何方法。
(2)准备数据:需要数值型或者布尔型数据。
(3)分析数据:有大量特征时,绘制特征作用不大,此时使用直方图效果更好。
(4)训练算法:计算不同的独立特征的条件概率。
(5)测试算法:计算错误率。
(6)使用算法:可以应用于文档分类等场景。
2 人工智能和机器学习的区别?
- 个人观点:
人工智能是让机器拥有智慧,通过学习获得感知、推理等能力。可以在复杂环境中自主的适应并解决问题。而机器学习是人工智能的一部分,它可以提供给机器各种各样的学习方法使其实现智能。是人工智能实现的基础,好像是一个构建机器大脑的工程。
3 什么是机器学习的过度拟合现象,以及过拟合产生的原因和解决方案
-
过拟合现象:
模型在训练数据上表现很好,但推广效果不好,不能很好地预测。
-
过拟合产生原因:
相对于训练数据的 量和噪声,模型过于复杂,对训练数据进行了过度学习。
-
解决:
简化模型,正则化(选择参数更少的模型、减少训练数据的属性数、限制一下模型);
收集更多的训练数据;
减小训练数据的噪声(修改数据错误或去除异常值)。
4什么是机器学习的欠拟合现象,以及欠拟合产生的原因和解决方案
-
欠拟合现象
模型不能很好地对训练数据进行拟合,预测也很难准确。 -
欠拟合产生原因
相对于训练数据的量和噪声,模型过于简单 -
解决
选择一个更复杂的模型,带有更多的参数;
用更好的特征训练学习算法(特征工程);
减小对模型的限制,比如减小正则化超参数。