北语22秋《大数据技术与应用》作业3[标准答案]_奥鹏作业答案_优学网_专业的奥鹏在线离线作业答案辅导网---,《大数据技术与应用》作业3,

加入收藏设为首页

北语北外: 北语22秋《大数据技术与应用》作业3[标准答案]
时间：2022-11-21 作者:在线来源：互联网点击：次

标签：

内容摘要：
北语22秋《大数据技术与应用》作业3[标准答案] 试卷总分:100 得分:100 一、单选题 (共 15 道试题,共 60 分) 1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为 A.1项集 B.2项集 C.3项集 D.4项集

可做奥鹏各院校作业、国开形考作业、各网院作业，联系:QQ3064302332 微信：wxxygzs

北语22秋《大数据技术与应用》作业3[标准答案]

试卷总分:100 得分:100

一、单选题 (共 15 道试题,共 60 分)

1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为

A.1项集

B.2项集

C.3项集

D.4项集

2.决策树生成过程中，以信息增益率作为特征选择准则生成决策树的算法是

A.ID3

B.C4.5

C.CART

D.以上都不对

3.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为

A.2

B.4

C.6

D.8

4.从软件库中导入LOF异常检测算法类的语句是

A.from sklean.neighbors import LocalOutlierFactor

B.clf=LocalOutlierFactor(n_neighbors=20)

C.y_pred=clf.fit_predict(X)

D.X_scores = clf.negative_outlier_factor_

5.数据等级排序T的是

A.定距等级>定比等级>定类等级>定序等级

B.定比等级>定序等级>定距等级>定类等级

C.定比等级>定距等级>定序等级>定类等级

D.定比等级>定类等级>定序等级>定距等级

6.用训练好的LOF实例判断数据是否异常，正常样本用1表示，异常样本用-1表示的语句

A.from sklean.neighbors import LocalOutlierFactor

B.clf=LocalOutlierFactor(n_neighbors=20)

C.y_pred=clf.fit_predict(X)

D.X_scores = clf.negative_outlier_factor_

7.不包含任何项的项集是指

A.项

B.空集

C.超项集

D.子项集

8.从软件库中导入模糊C均值聚类算法类的语句是

A.from fcmeans import FCM

B.fcm=FCM(n_clusters=3)

C.fcm.fit(X)

D.fcm_labels=fcm.u.argmax(axis=1)

9.如果一个项集包含K个项，则该项集称为

A.项

B.空集

C.超项集

D.K项集

10.利用pandas处理数据缺失值时，用于丢弃重复值的函数为

A.drop_duplicates

B.duplicated

C.fillna

D.dropna

11.常用于多变量噪声值(异常值)处理的方法是

A.等深分箱

B.聚类法

C.等宽分箱

D.盖帽法

12.数据集{1,2,3,5,7,9}的中位数是

A.3

B.5

C.7

D.4

13.利用pandas处理数据缺失值时，用于发现缺失值的函数为

A.isnull

B.head

C.tail

D.info

14.关联规则 X→Y 表示中Y称为

A.前件

B.后件

C.中间件

D.以上都不对

15.数据集{1,2,2,2,3,4}的众数是

A.1

B.2

C.3

D.4

二、多选题 (共 5 道试题,共 20 分)

16.聚类分析可以用于

A.顾客分组

B.分类

C.回归

D.找出显著影响

17.关联规则反映的是

A.可分类性

B.可分割性

C.事物之间相互依存性

D.事物之间相互关联性

18.大数据收集的途径包括（）

A.互联网

B.移动互联网

C.物联网传感器

D.手动

19.可用于实现数据one-hot编码的方法包括

A.Pandas的head

B.Pandas的get_dummies

C.sklearn.preprocessing.OneHotEncoder方法

D.Pandas的tail

20.决策树的关键点包括

A.采用Bagging框架

B.采用随机特征选择生成每个决策树的训练数据特征子集

C.采用采样数据集的特征子集训练对应决策树

D.以上都不对

三、判断题 (共 5 道试题,共 20 分)

21.定类数据层次比定序数据高

22.数据挖掘的过程都是有统一一致的步骤的

23.定序数据层次比定距数据高

24.下四分位数是指数据从大到小排列排在第25%位置的数字，即最小的四分位数(下四分位数)

25.上世纪 70 年代，随着数据库管理系统趋于成熟，存储和查询百万兆字节甚至千万亿字节成为可能。而且，数据仓库允许用户从面向事物处理的思维方式向更注重数据分析的方式进行转变。因此，提取复杂深度系信息能力非常强啊

分享到： QQ空间新浪微博人人网开心网百度空间和讯天涯社区

出处：奥奥鹏作业答案_优学网_专业的作业答案辅导网
网址：youxue100f.com转载时请注明出处和网址
作业答案_优学网_专业的在离线作业答案辅导网
联系：QQ：3064302332

上一篇：北语22秋《大数据技术与应用》作业4[标准答案]
下一篇：北语22秋《大数据技术与应用》作业2[标准答案]

最新更新

精彩推荐

热门点击

本类排行

作业资料综合信息发布网站
联系QQ:3064302332
优学网成考作业答案网为您服务！
QQ：3064302332

优学网100分作业答案
微信：wxxygzs
联系：QQ：3064302332

: 奥鹏东北大学 | 吉大 | 天津大学作业 | 南开作业 | 奥鹏作业答案 | 多肽合成 |

作业资料辅导平台_优学网滇ICP备2021005493号

北语22秋《大数据技术与应用》作业3[标准答案]

可做奥鹏各院校作业、国开形考作业、各网院作业，联系:QQ3064302332 微信：wxxygzs