只记得几个较难的题目,总结如下:
1、对于中小规模数据,希望获得最好的分类精度,下列哪种模型最适合:
A、Logistic B、随机森林 C、SVM D、决策树
逻辑回归的精度很低,泛化能力差,特别容易过拟合;随即森林也是一种决策树,决策树的最大缺点就是容易过拟合,剪枝带来的泛化能力的提升很小。只有SVM的分类精度较高,泛化能力强,但对于大规模数据,会因为数据维度的增大使得矩阵运算带来的复杂度大大提升,导致运行速度极慢。
2、元素1,2,3,4,5,6依次入一个空栈,出栈顺序为2,4,3,6,5,1,则该栈的大小至少为()
A、2 B、4 C、5 D、3
3、关于x,y的函数f(x,y)=x*e^(-x^2-y^2),(x,y ∈R), 则该函数有——2个极小值点。
4、下列代码将输出——
from sklearn.preprocessing import OneHotEncoder
ohe = OneHotEncoder(sparse=False)
x = [ [1,2,1],
[1,2,0],
[2,0,2],
[0,2,2] ]
x_onehot = ohe.fit_transform(x)
print( x_onehot.shape)
A、(4,8) B、(3,8) C、(3,4) D、(4,4)
编程题:
1、小易觉得高数课太无聊了,决定睡觉。不过他对课上的一些内容挺感兴趣,所以希望你在老师讲到有趣的部分叫醒他一下。你知道了小易对一堂课每分钟知识点的感兴趣程度,并以分数量化,以及他在课堂上每分钟的是否会睡着,你可以叫醒他一次,这会使得他在接下来的k分钟内保持清醒。你需要选择一种方案最大化小易这堂课听到的知识点分值。
输入描述:
第一行 n, k(1<= n, k<= 10^5),表示这堂课能持续多少分钟,以及叫醒小易一次使他能够保持清醒的时间。
第二行 n 个数, a1,a2,...,an (1 < = ai <=10^4) 表示小易每分钟知识点的感兴趣评分。
第三行 n个数, t1, t2, ..., tn 表示每分钟小易是否清醒, 1 表示清醒。
输出描述:小易这堂课听到的知识点的最大兴趣值。