大数据初级sy

时间:2024-03-11 08:54:01

1.spark 是用以下哪种编程语言实现的?

A.C             B  C++       C   JAVA               D.Scala (正确答案)

2.FusionInsight Manager 对服务的管理操作,下列说法错误的是?

A.可对服务进行起停重启操作  B.可以添加和卸载服务  C可设置不常用的服务隐藏或提示(正确答案)  D 可查看服务的当前状态

3.FusionInsight HD 集群升级,以下描述正确的有?(多选)

A 升级过程中不可以手工操作主备 OMS倒换(正确答案)

B 集群内所有主机的root账户密码要保持一致(正确答案)

C 保持网络畅通,避免因网络问题导致升级异常(正确答案)

D观察期不能做扩容(正确答案)

4.fusioninsight HD 的loader在创建作业时,连接器(connector)有什么作用?

A.确定有哪些转换步骤  

B.提供优化参数,提高数据导入导出性能

C配置作业如何与外部数据源进行连接(正确答案)

D配置作业如何与内部数据源进行连接

5.下列哪个HDFS命令可用于检测数据块的完整性?

A.hdfs fsck /(正确答案)

B.hdfs fsck / -delete

C.hdfs dfsadmin -report

D.hdfs balancer-threshold 1

6.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?

A.yarn scheduler capacity root QueueA user-limit-factor

B.yarn scheduler capacity root QueueA minimum-user-limit-percent

C.yarn scheduler capacity root QueueA state

D.yarn scheduler capacity root QueueA maximum-capacity(正确定位)

7.Flume的数据流可以根据header 的信息发送到不同的channel中.

A.正确 (正确答案)    B,错误

8.Fusioninsight Manager 与外部管理平台对接时,支持哪些接口?(多选)

A.SNMP (正确答案)

B.VPN

C.BGP

D.Syslog(正确答案)

9.Hbase的数据文件HFile中的一个KeyValue格式包含哪些信息?(多选)

A.Key (正确答案)

B.Value(正确答案)

C.TimeStamp(正确答案)

D.Key Type(正确答案)

10.FusionInsight HG集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络带宽要求的描述,下列描述正确的有?(多选)

A.业务平面所有节点都使用10GE网络(正确答案)

B,管理平面中控制节点使用10GE网络

C.管理平面中数据节点使用10GE网络(正确答案)

D.管理平面中控制节点使用10GE网络

E.管理平面中管理节点使用10GE网络(正确答案)

11.FusionInsight系统中Hive支持的存储格式包括?(多选)

A.HFile   

B.TextFile(正确答案)

C.SequenceFile(正确答案)

D.RCFile(正确答案).

12.Spark任务的每个stage可划分为job,划分的标记是shuffle.

A.正确   B.错误(正确答案)

13.FusionInsight Manager 对服务的配置功能说法不正确的是?

A.服务级别的配置可对所有实例生效

B.实例级别的配置只针对本实例生效

C.实例级别的配置对其它实例也生效(正确答案)

D.配置保存后需要重启服务才生效

14.FusionInsight HD部署Solr时,如果选择索引存放在本地磁盘,建议给每个SolrServer实例的数据目录单独挂载磁盘,并且磁盘为RAID0或RAID5.

A.对(正确答案)    B.错

15.关于FusionInsight HD安装流程正确的是?

A.安装Manager--执行preinstall--LLD工具进行配置---安装集群--安装后检查--安装后配置

B.LLD工具进行配置--执行reinstall--安装Manager--安装集群--安装后检查--安装后配置(正确答案)

C.安装Manager--LLD工具进行配置--执行preinstall--安装集群--安装后检查--安装后配置

D.LLD工具进行配置--执行preinstall--安装集群--安装Manager--安装后检查--安装后配置

16.关于Kerberos部署,描述正确的是?

A.Kerberos仅有一个角色

B.Kerberos服务在同一个节点上有两个实例(正确答案)

C.Kerberos服务采用主备模式部署

D.Kerberos服务必须和LDAP服务部署在同一个节点上

17.某银行规划的FusionInsight HD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划多少最为合理?

A.87(正确答案)

B.85

C.90

D.86

18.安装FusionInsight HD软件包前,必须在本节点/etc/hosts文件中配置集群所有节点的主机名称与业务IP的映射关系.

A.正确(正确答案)  B.错误

19.客户IT系统中FusionInsight HD集群有150个节点,每个节点12块磁盘(不做RAID,不包括OS盘),每个磁盘大小1T,只安装HDFS,按照默认配置最大可存储多少数据?

A.1764TB

B.1800TB

C.600TB

D,500TB(正确答案)

20.FusionInsight HD节点不支持哪种主机操作系统?

A.Suse

B.RedHat 6.5

C.CentOS 6.4

D.Ubuntu 11.0.4(正确答案)

21.FusionInsight HD中,如果需要检查当前登录HBase的用户和权限组,可以在HBase shell中执行什么命令?

A.use_permission

B.whoami(正确答案)

C.who

D.get_user

22.FusionInsight HD产品在部署Kerberos和LDAP服务时,一下描述正确的是?(多选)

A.部署Kerberos服务之前,必须先部署LDAP服务(正确答案)

B.LDAP服务必须和Kerberos服务部署在同一个节点

C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提升(正确答案)

D.LDAP服务可以多个集群共享

23.FusionInsight HD Manager界面Hive日志收集,哪个选项不正确?

A.可指定实例进行日志收集,比如指定单独收集MetaStore的日志

B.可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志

C.可指定节点IP进行日志收集,例如仅下载某个ip的日志

D.可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)

24.华为FusionInsight HD集群中,Spark 服务可以从以下哪些服务读取数据?(多选)

A.YARN

B.HDFS(正确答案)

C.Hive(正确答案)

D.HBase(正确答案)

25.如果YARN集群中只有Default ,QueueA和QueueB子队列时,那么允许讲他们的容量分别设置为60%,25%和22%.

A.正确    B.错误(正确答案)

26.FusionInsight HD系统中,关于Solr索引的存储部署策略,一下说法正确的有?(多选)

A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储于HDFS.(正确答案)

B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据

C.当对实时索引录入速度要求较高时,可选择索引存放于本地磁盘.(正确答案)

D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上.(正确答案)

27.FusionInsight HD三层组网适合多少节点的集群规模?

A.30节点一下7

B,100节点以上

C.100~200节点

D.200节点以上(正确答案)

28.FusionInsight HD系统中,Kerberos仅用于组件间服务安全认证.

A.正确

B.错误(正确答案)