一、研究所概况
复旦大学大数据研究院人文社会科学数据研究所成立于2017年5月,挂靠复旦大学图书馆,依托复旦大学大数据学院与大数据研究院的技术力量、先进设施和成果转化服务能力,重点建设人文数据平台(中华文明数据中心)、社会科学数据平台(社会科学数据研究中心)和人文社科大数据实验室,旨在推动大数据与人文社科各学科的交叉研究与科研成果转化,构建以人文社会科学数据为内核的跨学科研究平台,整合校内外相关研究数据,为复合型人文社会科学大数据人才培养提供支撑,为相关学科研究提供数据监护技术支持和数据共享交换服务,为相关产业需求培育科研成果。
二、“2+2+4”模式
人文社科数据研究所采用“2+2+4”模式,汇聚复旦最具特色和影响力的人文、社科2类学术资源与研究成果,依托2个平台、重点建设4个专题数据库。
◆“2类资源”
人文数据资源主要涉及东亚语言数据、当代中国生活资料、古籍、民国书刊、地方志、少数民族文献等。社科数据资源包括复旦大学能源流向与碳排放因子数据库等500余数据集。两类资源存储总量达200T.
◆“2个平台”
2014年上线的复旦大学社科数据平台,基于哈佛大学IQSS开源软件Dataverse建设。平台有数据共享、数据监护、数据引证、数据收割等特色功能,目前已上线数据集500余个,用户浏览量达300万余次。平台为彭希哲教授牵头的国家自科基金重大项目团队提供数据协同服务。
“慧源上海教育资源共享平台”是由上海市教委牵头,上海地区多家高校图书馆共同参与的资源共享项目。平台汇集了9所高校的特色资源40万余件,与38所上海高校共享优质教育资源。平台荣获2016年上海市智慧城市建设优秀实践成果奖,2017年上海科技情报成果奖二等奖。
◆“4个专题数据”
◇潘悟云团队——东亚语言数据库
东亚语言数据库收集了1100个汉语方言点,302个民族语语言点,是迄今为止全球最大的东亚语言数据库。不断完善中的中国境内语言地理信息系统,是国内语言数据规模最大、制图功能最丰富的语言地理信息系统。
◇张乐天团队——当代中国社会生活资料数据库
当代中国社会生活资料数据库收藏有数据档案、文书档案、书信、日记、工作笔记等各类资料70余万件,约300万页。首创“社会生活资料”概念得到业界认可。
◇彭希哲团队——社会科学数据专题数据库
社会科学数据专题数据库包括长三角地区社会变迁调查、长江流域经济带数据库等珍贵资源,基于该数据开展的政策评估指标和模型、政策模拟与仿真,取得了丰富的科学研究与政策咨询成果。
◇复旦大学图书馆古籍专题数据库(建设中)
古籍专题数据库珍本荟萃,共40万册。四部典籍,大致齐备。其中善本书7000余种,抄本、稿本近2000种,清刻孤本、稀见本、精本、批校本3000余种,目前正在进一步建设中。
三、团队介绍
研究所现有成员11人,学科背景丰富,包括计算机科学、统计学、图书情报学、语言学、人口学、社会学、政治学、法学等。
研究所领导
所长:陈思和
副所长:张计龙(常务)、程远、龙向洋、张成洪
学术委员会主任:彭希哲
副主任:刘炜
学术委员会委员:顾东辉、龙向洋、潘悟云、任树怀、薛向阳、严锋、张乐天、张计龙、张涛甫、张晓虹、郑磊
四、机构设置
·学术委员会
·所务委员会
·东亚语言研究中心
·当代中国社会生活资料馆
·科学数据研究中心
·数据服务部
·办公室