可做奥鹏全部院校作业、国开形考作业答案、在线作业、离线作业、答案联系 微信:wxxygzs
东财22秋《数据分析与决策》单元作业一[有全部答案]
一、单选题 (共 5 道试题,共 25 分)
1.( )是后续的数据转化、模型计算的必要前提。
A.变量大小
B.变量转换
C.变量类别
D.变量类型
2.如果同为无偏估计的两个统计量,一个比另外一个的估计量的方差小,就可以将方差( )的估计量称为有效估计量。
A.大
B.小
C.相同
D.随机
3.根据数据分析的目的,需要确定每一行都是( )的实体。
A.异质
B.同质
C.随意
D.有结构
4.交叉变量规则除了包括名称外,还包括( )。
A.表达式
B.函数
C.公式
D.代数式
5.在现实世界中一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小,总的影响可以看作是服从( )的。
A.正态分布
B.卡方分布
C.t分布
D.F分布
二、多选题 (共 5 道试题,共 25 分)
6.一般来讲,统计量的标准有( )。
A.无偏性
B.有偏性
C.一致性
D.有效性
7.下列关于决策表的说法错误的有( )。
A.决策表是指尝试从模型训练中发现一些规则
B.决策树和决策表是完全不相同的,也完全不相似
C.决策表的规则和记录是一一对应的
D.决策表按照规则的顺序来决定规则的优先级
8.下列关于差异的说法正确的有( )。
A.偶然因素引起的差异往往是比较显著的
B.差异的绝对值大于给定的标准的概率分布区间称为拒绝区间
C.事件属于接受区间则判断总体无显著差异
D.事件属于拒绝区间,则认为总体有显著差异
9.假设检验的步骤是( )。
A.提出假设
B.规定显著性水平
C.构造检验统计量
D.做出拒绝或接受零建设的决策
10.神经元网络的拓扑结构可以分为( )。
A.前向型
B.反馈型
C.自组织竞争型
D.随机型网络
三、判断题 (共 10 道试题,共 50 分)
11.常用的数据调整方法有最大/最小转换和Z得分转换。( )
12.最近相邻算法中的邻居的远近是按照距离函数计算的。( )
13.卡方分布是通用的变量间是相互关联的统计模型。( )
14.一般来说,如果样本容量越大,估计量会更接近总体参数。( )
15.在数据挖掘中的一个预测算法中,输入数据太少,会大大影响数据挖掘的准确度。( )
16.在前向型的神经网络中,每个输入字段都会对应一个输入神经元。( )
17.对于每次抽样,所决定的统计量取值和总体参数的误差只能是正的。( )
18.构建贝叶斯网络过程需要经过构建有向无环图和计算图中有向边的条件概率表两个步骤。( )
19.数据集中的异常数据和重复数据都可能对建模的速度和精确度造成影响。( )
20.最大间隔分类器是通过计算空间的离散点距超平面的距离,找到一个合适的超平面。( )