1、全英文试卷,可以用中文作答,时间2h,普遍反映时间不足;
2、可以带的设备:计算器(必需)
3、题型:填空题(2*8),大题
4、题目记录:
① 填空题:数据预处理的步骤、求z分数、余弦相似性
② 大题:(有遗忘的大题和小题)
第一题:给出生病的表格;
求对称二元相似性、非对称二元相似性。
画出期望混淆矩阵
第二题:
解释一下基于像素的可视化技术
第三题:
给出一串数字,画出盒图
第四题:
用Apriori算法算出所有的频繁模式
第五题:
画出决策树,这里需要计算信息增益
用贝叶斯网络判断
第六题:
k-means:说明k-means通过什么参数衡量,用户需要定义什么参数。
给出一串数字,写出利用k-means算法最开始的簇是怎么分的,最后稳定了之后,簇是什么样的。