作业 考核 论文 答案联系 QQ:3064302332 微信:wxxygzs
南开23秋学期(仅限-高起专1909、专升本1909)《并行程序设计》在线作业[标准答案]
试卷总分:100 得分:100
一、单选题 (共 50 道试题,共 100 分)
1.OpenMP是___的一个常见替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
2.为了解决CPU内流水线深度限制,主要的技术手段是____。
A.降低指令复杂度
B.去掉分支预测功能
C.增大核心数
D.超标量技术
3.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法
B.寄存器间双精度浮点数向量加法
C.寄存器内单精度浮点数加法
D.寄存器内双精度浮点数加法
4.采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。
A.n
B.t
C.n-t
D.n/t
5.程序访存更多在____中命中,可最大程度提高性能、降低功耗
A.本CPU cache
B.本CPU主存
C.本结点其他CPU主存
D.远端结点主存
6.动态任务划分相对于静态任务划分的缺点是____。
A.可能导致负载不均
B.通信开销高
C.任务粒度粗
D.计算复杂度高
7.对于向线程函数传递参数,下列说法错误的是____。
A.线程函数并非用户程序调用,因此无法直接传递
B.线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象
C.线程通常通过此途径获取线程号
D.不同线程间的参数传递相互无关,即使它们具有相同的线程函数
8.FORTRAN语言存储二维数组采取____。
A.行主次序存储
B.列主次序存储
C.交错式存储
D.对角线存储
9.用GCC编译器编译SSE intrinsics程序,需使用编译选项
A.-march=corei7
B.-g
C.-O
D.-O2
10.____不是SIMD架构。
A.SSE
B.超线程
C.AltiVec
D.Neon
11.关于MPI_recv对源地址的标识,下列说法正确的是____。
A.只能使用进程编号
B.可以使用IP地址
C.可以使用IPV6地址
D.可以使用MPI_ANY_SOURCE
12.记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。
A.pT
B.T'+T
C.p(T'-T)
D.pT-T'
13.Pthread不支持____。
A.创建并发执行线程
B.同步
C.非显式通信
D.自动并行化
14.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则输出顺序____。
A.必然是0 1 2 3
B.必然是4 3 2 1
C.不可能是4 3 2 1
D.以上皆错
15.新一代GPU重点提供的新特性不包括____。
A.新型高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
16.对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?
A.将空间离散化为网格
B.在网络上进行局部计算
C.局部计算结果完全独立
D.重复若干时间步
17.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。
A.正确的
B.错误的
18.我们在小规模系统和小规模输入下测试了几个并行算法,应选择哪个应用在实际系统中?
A.选择性能测试并行时间最少者
B.选择性能测试加速比最大者
C.选择性能测试效率最高者
D.应结合可扩展性分析做出选择
19.对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A.声明语句
B.条件分支语句
C.循环语句
D.输入输出语句
20.OpenMP并行模型是一种____编程模型。
A.静态线程
B.动态线程
C.混合线程
D.众核
21.和一对多广播对应的组通信操作是____。
A.多对一收集
B.多对多收集
C.多对一归约
D.多对多归约
22.天河1号、天河2号、神威.太湖之光总体上都是____架构
A.单核
B.多核
C.众核
D.集群
23.MPI程序中发送和接收消息的两个进程必须____。
A.在同一个网段中
B.连接在同一个路由器上
C.在同一个通信域中
D.以上皆错
24.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。
A.将第一个源寄存器的第j个元素放在目标寄存器位置0
B.将第二个源寄存器的第j个元素放在目标寄存器位置0
C.将第一个源寄存器的第j个元素放在目标寄存器位置j
D.将第二个源寄存器的第j个元素放在目标寄存器位置j
25.OpenMP循环并行指令是____。
A.omp parallel
B.omp single
C.omp parallel for
D.omp master
26.SIMD架构未见于_____中。
A.多媒体扩展
B.图形和游戏处理器
C.计算机集群
D.协处理器
27.如果运算对象是独立无关的变量,则在向量运算之前需____。
A.将变量拷贝到连续区域
B.将变量地址拷贝到连续区域
C.将变量逐个传输到向量寄存器
D.以上皆错
28.OpenMP编译指示中说明共享变量是用____子句。
A.private
B.shared
C.schedule
D.nowait
29.主线程通过____函数获取特定线程的返回结果。
A.pthread_create
B.pthread_join
C.pthread_cancel
D.pthread_get
30.以下哪条不是推动并行计算发展的因素?
A.存储是系统瓶颈
B.单CPU发展已能满足应用需求
C.利用标准硬件构造并行机令升级容易
D.编程环境标准化逐步发展
31.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
A.大小
B.时序
C.时长
D.cache局部性
32.CPU cache大小为32KB,如希望(单精度浮点数)矩阵乘法计算过程中所有数据都驻留cache中,则矩阵大小最大为
A.16*16
B.32*32
C.64*64
D.128*128
33.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
A.特殊硬件
B.通用硬件
C.非公开硬件
D.廉价硬件
34.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。
A.按编号顺序依次从从进程接收结果
B.按编号逆序依次从从进程接收结果
C.按编号顺序、逆序交替从从进程接收结果
D.使用MPI_ANY_SOURCE和MPI_ANY_TAG
35.Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?
A.SISD
B.SIMD
C.MISD
D.MIMD
36.我国首次获得戈登?贝尔奖是在____年。
A.2015
B.2016
C.2017
D.2018
37.多线程是____架构下的并行模式。
A.MIMD
B.共享内存
C.分布式内存
D.分离式地址空间
38.OpenMP循环划分策略不包括____。
A.static
B.fixed
C.dynamic
D.guided
39.SSE intrinsics _mm_store_sd命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存双精度浮点数
D.未对齐标量存双精度浮点数
40.关于消息传递编程的特点,以下说法正确的是____。
A.与共享内存一样有竞争条件
B.编程简单
C.需程序员考虑局部性
D.无需考虑进程间通信
41.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A.取指令
B.解码
C.安全性检查
D.执行指令
42.MPI程序中默认的通信域是____。
A.MPI_ANY_SOURCE
B.MPI_ANY_TAG
C.MPI_ANY_COMM
D.MPI_COMM_WORLD
43.矩阵每行排序的问题更适合使用MPI的____编程模型。
A.阻塞的
B.非阻塞的
C.对等的
D.主从的
44.对于加速比S和处理器数量p,下列说法正确的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.两者无关联
45.对于向量化,以下说法错误的是____。
A.总会有打包/解包开销
B.若运算对象连续存储,可消除打包开销
C.若运算结果连续存储,可消除解包开销
D.打包/解包开销由数据存储决定
46.记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A.pT'=T
B.E=Θ(1)
C.E=pT/T'
D.E=T'/pT
47.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。
A.初始化
B.阻塞
C.继续执行
D.销毁
48.并行算法设计所做的事情不包括____。
A.分解计算工作分配给多个处理器
B.保持数据依赖保证结果正确
C.确保不能产生重复计算
D.尽量降低通信等额外开销
49.MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
50.下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A.矩阵求和
B.矩阵相乘
C.矩阵向量相乘
D.高斯消去