资料简介
事业单位招聘考试《数据科学与大数据技术》题库(答案+解析)
1. 以下关于HiveSQL基本操作描述正确的是( )。
A、创建外部表必须要指定Location信息
B、创建外部表使用external关键字,创建普通表需要指定internal关键字
C、加载数据到Hive时源数据必须是HDFS的一个路径
D、创建表时可以指定列分割符
【答案】D
【解析】建立外部表可以不指定Location,会在默认在/hive/warehouse/数据库名称/表名,建立目录。创建内部表时不需要关键字。加载数据到Hive时源数据不一定是HDFS的一个路径。故选D。
2. 为了保障流应用的快照存储的可靠性,快照主要存储在哪里?( )
A、jobmanager的内存中
B、可靠性高的单机数据库中
C、本地文件系统中
D、hdfs中
【答案】D
【解析】为了保障流应用的快照存储的可靠性,快照主要存储在hdfs中。故选D。
3. 下列关于数据交易市场的说法中,错误的是( )。
A、数据交易市场是大数据产业发展到一定程度的产物
B、商业化的数据交易活动催生了多方参与的第三方数据交易市场
C、数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
D、数据交易市场是大数据资源化的必然产物
【答案】C
【解析】数据交易市场通过研发和分析数据,为数据交易提供帮助,并不生产数据。故选C。
4. HFile数据格式中的Data字段用于( )。
A、存储实际的KeyValue数据
B、存储数据的起点
C、指定字段的长度
D、存储数据块的起点
【答案】A
【解析】hfile是hbase中存储数据的文件,图1描述了hfile文件格式。hfile文件由6部分组成:datablock,metablock(可选),fileinfo,datablockindex,metablockindex,trailer。datablock存储了表数据,metablock存储了布隆过滤器索引数据,fileinfo存储了本文件的相关信息,index存储了datablock和metablock的索引数据,trailer存储了本文件的相关信息。故选A。
5. 以下哪个部分不是一篇数据分析报告必须有的?( )
A、标题
B、正文
C、结论与建议
D、附录
【答案】D
【解析】附录不是一篇数据分析报告必须有的。故选D。
发表评论