LI YUAN TU ZHI
荔园图志
第26期
斯坦福大学图书馆创建新部门以支持学者的数据需求
斯坦福大学图书馆新设了研究数据服务部门,名为 Data,RDS。此部门将与校内其他单位如研究计算中心等联手斯坦福大学图书馆,向全校的斯坦福学者提供数据支持。
RDS的成立目的在于,整合数字人文、地理空间分析、计算社会科学和统计学等领域的学术研究,同时涵盖科学、技术、工程、数学教育等学科的数据管理,以此支持数据的完整生命周期,并促进数字学术的发展。
Peter 是那项研究数据服务的第一位助理馆长,他任职斯坦福大学前,曾担任耶鲁大学图书馆数字人文实验室的负责人,也曾在芝加哥大学负责过人文研究的计算工作。
Peter谈到斯坦福大学图书馆设立RDS的原因,说明数据演变的过程,并阐述这个新部门怎样为斯坦福大学不同领域和学科的学者提供支持。
为什么创建研究数据服务部门?
研究人员在各个领域都要处理来自多方的海量资料:既有自己进行实验或考察所得,也有商业公司提供、政府部门以及文化保护单位等渠道的数据。这些资料形态多样,比如抵押贷款的文件、亚马逊雨林上空的遥感照片,或是成千上万本已数字化的典籍。从研究工作的实际需求角度出发,比如为了保障地球能够持续发展,都必须以采集到复杂的大规模资料集,并且能够运用这些资料集为基本条件。
斯坦福大学图书馆旨在辅助科研人员全流程的数据活动,涵盖数据搜寻或采集阶段,涉及数据整理与优化环节,包含算法运用和量化研究时期,以及数据归档至存储库环节。该馆计划在既有常规服务之上持续进步起步网校,同时通过服务科研人员所积累的实践认知,来规划后续工作方向。
已有的哪些服务可促进RDS?
斯坦福地理空间中心,致力于支撑空间数据科学的相关资源;跨学科研究中心,专注于设计并构建数据工具及方法;大学图书馆,设有科学数据管理专家;以及大学图书馆,配备数字研究系统建设人员。图书馆期待这些团队持续努力,在已有任务(涵盖信息收集、授权、维护、归档和分发)上更进一步,致力于实现更明确、更便捷的线上及线下支持。
已有部门在RDS服务中支持学者的案例有哪些?
斯坦福地理空间中心是这所高校在GIS即地理信息系统以及空间数据科学领域的关键支撑机构,其空间技术与方法具备跨学科应用价值。比如,此类技术能够协助海洋生物研究者描绘加利福尼亚沿岸当前海洋生物的分布格局,同时也可供研究塞勒姆女巫审判的历史学者考察17世纪原告与被告的地理分布情况。
跨学科研究中心的成员包括各类专业技术人员,他们致力于协助特定项目或单位开展数字化学术探索工作。该中心还配备有专门从事软件开发的工程师,他们负责为教师的研究项目打造相关应用工具。数据科学软件与服务团队会协助学者掌握 R 等关键语言,这些语言对于文本处理和数据分析至关重要。
另外,新组建的RDS部门也有职员把为数百万的记录数据集加以处理和丰富,使其变为研究人员能够应用的形态,并且把它们保存在斯坦福大学图书馆的计算机中。图书馆还配备有科学馆员对研究计划所获成果进行归类,目的是为了同他人交流资讯。
谁可以使用 RDS,是否需要付费?
RDS 向所有斯坦福大学学者提供免费服务。对于有疑问的学生,特别是涉及多语言文本分析方面;对于感兴趣的博士后,尤其是地理空间工具和数据;对于寻找数据的教职员工,尤其是相关项目,RDS 都能给予支持。
与数据打交道的过程中是否有困难或担忧?
维护科研资料的全部过程非常有益,包括搜集或发掘,还有整理或转化为更便于运算的状态,也涉及对资料进行实际操作(在常规或神经网络环境中),最终将由此产生的学术成果妥善保存为长久档案,供后续探索和验证。各项流程的具体实施会因领域、单位及个人经历而存在差异,斯坦福大学图书馆有责任尽可能全面地掌握这些流程,学科专家在此过程中扮演着关键角色。
现在关于“大数据”的许多探讨,越来越常牵涉到偏见、算法危害斯坦福大学图书馆,以及训练数据缺乏代表性或不完整等议题。图书馆需要留意数据可能带来的危害,期待斯坦福大学图书馆能持续作为讨论这些议题和顾虑,并寻求对策的场所。
RDS 是斯坦福大学唯一提供数据和数字学术帮助的地方吗?
不是这样的。RDS遍布学校的各个院系和图书馆环境中,部分属于这些学术机构,依靠各自的领域知识为科研人员提供重要的支持。比如,莱恩医学图书馆的同事对医学研究中的数据使用问题十分清楚,比如美国国立卫生研究院提出的新数据管理与共享规定。商学院的学术机构与藏书楼另配有见识丰富的专家队伍,针对GSB集体给予诸多数据及探究方面的协助。再者,斯坦福大学研究计算中心(SRCC)担当高性能运算的核心,具备海量运算和资料库的专长、指导与阅历,对于促进斯坦福大学的学术活动起着决定性功效。
叶兰,翟莉莉,黄旭根据不熟悉的数据需求进行了编译。