考试指导范围如下:
一、考试目标
考察考生是否掌握科学数据管理、数字图书馆、数字人文等相关的基础理论和实践技能,是否具备分析国内外科学数据管理及数字图书馆相关的政策、标准和规范的能力,能否初步运用相关理论与方法分析和解决实际问题,能否在理论和实践之间建立联系,解决跨学科的数据管理与应用问题,是否能够适应不断变化的数据环境和要求。
二、考试要求
1. 掌握科学数据管理及其相关概念的定义并理解其重要性,了解科学数据管理的基础理论、基本流程和方法;
2. 了解国内外科学数据管理的政策、标准和规范,了解数据开放获取和数据交换标准,并理解数据伦理、数据安全和隐私保护等相关概念;
3. 初步掌握科学数据的元数据管理、数据描述和数据编目等关键技能;
4. 了解并掌握科学数据管理计划的制定和实施,包括数据管理政策制定和数据管理流程设计等;
5. 了解数据库技术的基本概念,包括数据描述、数据模型、数据库系统等;
6. 了解数据分析与数据挖掘的基本概念、过程和方法,并了解其常用技术、适用场景和典型应用案例;
7. 了解数字图书馆的历史、现状与未来发展趋势,了解其功能定位、体系构成和相关技术框架;
8. 了解数字人文的定义、发展和当前趋势,理解数字技术和工具如何影响人文社科领域的研究;
9. 了解数字人文研究的方法和工具。
三、考试内容
第一部分:科学数据管理
(一)科学数据管理基础理论
1. 科学数据管理的定义与范畴
2. 数据生命周期管理的各个阶段
3. 数据质量与数据治理的基本原则
4. 数据伦理与数据隐私保护
(二)科学数据管理技术与工具
1. 数据库管理系统(DBMS)的基本原理
2. 关系数据库与非关系数据库的应用
3. 数据挖掘与分析工具的使用
4. 数据可视化技术与方法
(三)数据收集与处理
1. 数据采集方法与技术
2. 数据清洗与预处理流程
3. 数据转换与集成技术
4. 数据压缩与优化策略
(四)数据存储与安全
1. 数据存储技术与解决方案
2. 数据备份与恢复机制
3. 数据加密与访问控制
4. 数据安全法规与合规性
(五)数据分析与应用
1. 统计分析方法与应用
2. 数据挖掘算法与机器学习基础
3. 大数据分析技术与实践
4. 数据分析结果的解释与应用
(六)科学数据管理政策与规范
1. 国内外科学数据管理政策概述
2. 数据管理标准与规范的应用
3. 数据共享政策与实践
4. 数据开放获取与数据交换标准
(七)数据管理计划与项目管理
1. 数据管理计划(DMP)的制定
2. 项目管理工具与方法
3. 风险管理与质量控制
4. 数据管理流程的设计
第二部分:数字图书馆
(一)数据库系统基础
1. 数据描述、数据模型
2. 数据库的体系结构和管理系统
3. 关系数据库的规范化设计
(二)数据分析与数据挖掘基础
1. 数据分析和数据挖掘的基本概念和过程
2. 分析与挖掘的数据类型
3. 数据分析与数据挖掘的方法和技术
(三)数字图书馆基础
1. 数字图书馆的定位、组成与基本功能
2. 数字图书馆相关技术
3. 数字图书馆的发展方向及未来趋势
第三部分:数字人文
(一)数字人文基本概念
1. 技术、媒介与信息
2. 数字化与基础设施
3. 大数据与数据处理
(二)数字人文主要工具
1. 语料库工具
2. 自然语言处理工具
(三)数字人文主要分析方法
1. 信息的量化
2. 自然语言处理与知识图谱
3. 文本挖掘:以自然语言处理为例
四、参考书目
[1] 数据库系统教程(第3版).施伯乐,丁宝康等.高等教育出版社,2008
[2] 科学数据管理与共享的理论与实践.司莉,邢文明.武汉大学出版社,2017
[3] 研究数据的管理与共享:最佳实践指南(中文翻译版).(英)科尔蒂.科学出版社,2018
[4] 数据分析与数据挖掘(第2版).喻梅,于健.清华大学出版社,2020
[5] 数字人文导论.彭青龙,都岚岚.上海交通大学出版社,2024