机器学习笔试

  1. 分词方法大致可分为三大类:基于字符串匹配的分词方法(机械分词方法)、基于统计的分词方法和基于理解的分词方法。机械分词方法主要有整箱最大匹配算法、逆向最大匹配算法、双向最大匹配算法和最少切分算法。
  2. ID3算法要求特征必须离散化
  3. 关键词选取的方法主要有两种:无监督的方法,利用候选关键词的统计性质,对他们排序,选取最高的若干个作为关键词;有监督的方法,将关键词抽取问题转换为判断每个候选关键词是否为关键词的二分类问题,他需要一个已经标注关键词的文档集合训练分类模型。
    多标签分类方法是关键词分配的方法。
    基于标注图的方法和基于内容的方法是社会标签推荐的方法。
    基于图的无监督方法
    基于分类的有监督方法
  4. 主动学习方法:有时候,有类标号的数据比较稀少而没有类标号的数据相当丰富,但是对数据进行人工标注有非常安规,此时学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。
    故主动学习并不属于监督学习、无监督学习和半监督学习的范畴,因为主动学习过程中指的是主动提出标注请求,也就是需要一个外在的能够对其请求进行标注的实体(通常是相关领域专业人员),即主动学习是交互进行的。
    而半监督学习指的是学习算法不需要人工干预,基于自身对未标记数据加以利用。
  5. 下列属于特征选择方法的是( )A模拟退火算法B序列浮动算法C分支限界算法D双向搜素算法
  6. 测试用例=变量数*(每个变量的取值数-1)+1
  7. 自顶向下的语法分析方法:
    (1)递归子程序法(2)LL(1)分析法
    自底向上的分析技术 有:
    ( 1 )简单优先分析法
    ( 2 )算符优先分析法
    ( 3 )优先函数
    ( 4 ) LR 分析法

猜你喜欢

转载自blog.csdn.net/qq_43424748/article/details/85565285