数据通常被定义为记录事实材料在学术界普遍接受必要的文档和支持研究成果(修改的国家卫生研究院的数据共享政策和实施指导)
一个简单的定义:数据是任何你执行分析。(来源:数据管理人员克里斯汀Briney)
在学科合作正是数据可以有很大区别。数据可以包括:
研究数据管理(RDM)是广义的编译小实践,使数据更容易找到,更容易理解,更不太可能会丢失,可能是有用的在一个项目或十年后。RDM可以包括数据管理计划,记录数据,整理数据,提高分析程序,确保敏感数据正确,有足够的存储和备份项目期间,照顾数据后项目,有效地共享数据,发现数据重用的一个新项目。(来源:数据管理人员克里斯汀Briney)
研究数据管理的最佳实践
一个简单的定义:数据是任何你执行分析。(来源:数据管理人员克里斯汀Briney)
在学科合作正是数据可以有很大区别。数据可以包括:
- 研究报告或实验室笔记本
- 调查结果
- 软件和代码
- 测量从实验室或现场设备
- 图像(如照片、电影、扫描,或放射自显影图)
- 录音
- 实物样品
研究数据管理(RDM)是广义的编译小实践,使数据更容易找到,更容易理解,更不太可能会丢失,可能是有用的在一个项目或十年后。RDM可以包括数据管理计划,记录数据,整理数据,提高分析程序,确保敏感数据正确,有足够的存储和备份项目期间,照顾数据后项目,有效地共享数据,发现数据重用的一个新项目。(来源:数据管理人员克里斯汀Briney)
研究数据管理的最佳实践
责任在图书馆,我们来帮助!我们提供:
- 个性化的磋商发展和实施的研究数据管理实践。
- 指令要求的其他方法(讲习班,研讨会等等。)
由于数字数据的扩散和数据共享要求的增加,大量的研究数据都能在网上找到。在大多数情况下,您可以重用这些数据用于自己的研究。
公共数据来源
发现数据中使用特定的文章
公共数据来源
- figshare——开放存储库的数据从所有学科
- Dataverse——开放存储库的数据从所有学科
- 运用服务——美国政府开放数据“家”
- ICPSR——政治和社会科学研究
- iPoll——美国民意测验数据
- 美国人口普查局——人口数据对美国、波多黎各、和岛屿领土从人口普查和其他调查
- 英国数据档案——“英国最大的数字研究数据收集在社会科学和人文学科”
- GitHub——计算机代码
发现数据中使用特定的文章
- 在出版商的网站上寻找一个supplmentary数据文件
- 联系相应的作者要求他们与你分享文章的数据
- 吉姆房龙联系,研究数据或者图书馆馆员。图书馆员的专家发现的东西!
- 看看数据集上的许可——许可会告诉你你能(不能)的数据。常见的许可证包括一个Creative Commons许可或者一个开放数据共享许可。但并不是所有的数据集有一个许可证。
- 给应得的学分——在一个出版物或演示,给的完整引文数据集(就像期刊文章)。至少,引文应包括作者,出版的数据,标题、出版商或经销商和电子位置或标识符(比如一个永久的URL或DOI)。看到这个在线指导使用MLA引用数据集、APA和芝加哥风格。
你的研究数据是非常宝贵的应该存储在一个安全的位置。这样做会减少数据丢失的可能性。当考虑存储的研究数据,按照锁原则:大量的副本,保证物品的安全。
或者政策860状态数据(包括数据)的研究只能存储在大学提供的数据系统。这一政策不包括使用服务如Dropbox和盒子来存储数据。
最佳实践:
最佳实践数据存储与安全
或者政策860状态数据(包括数据)的研究只能存储在大学提供的数据系统。这一政策不包括使用服务如Dropbox和盒子来存储数据。
最佳实践:
- 选择稳定的存储硬件如外部硬盘或服务器。更方便和failable存储硬件(如USB驱动器)应该用于数据传输,不存储。
- 练习3-2-1规则。你应该有三份数据在两个不同的存储介质和一份离线位置。
- 测试你的定期备份确保他们正常工作,您可以访问您的数据,以防你失去了主数据的副本。
最佳实践数据存储与安全
研究的一个主要挑战是跟踪你的研究数据。遵循一致的数据组织和文档程序将帮助你(和其他人)能够找到并理解你的研究数据。
数据文档提供上下文来理解和使用您的数据。文档可以采取许多形式包括方法、ReadMe。txt文件、研究报告和代码的书。数据组织结构提供了一个研究数据。数据组织方法的例子包括文件命名约定和文件版本控制。
最佳实践:
数据文档提供上下文来理解和使用您的数据。文档可以采取许多形式包括方法、ReadMe。txt文件、研究报告和代码的书。数据组织结构提供了一个研究数据。数据组织方法的例子包括文件命名约定和文件版本控制。
最佳实践:
- 为您的数据创建一个程序用于创建文档。所需的文档类型,如何捕获depedent研究项目。确保你的文件安全地存储你的研究数据!
- 使用文件的命名约定(FNC)。FNC赋予一个唯一的名称,每个文件描述其内容及其与其他文件。普渡大学图书馆的文件命名规范指南在开发自己的FNC提供了明确的指导方针。别忘了你FNC文档的意义!
- 使用文件版本跟踪你的进展。跟踪文件版本的最简单的方法是添加‘v01’,‘v02’,等年底FNC。每个变更后版本号更新到文件中。使用版本名称不喜欢“最后”,“初始”,“最后”,等等。或者使用软件跟踪文件版本为你如Google Docs。
- 最重要的是:与您的数据文件和组织实践是一致的。确保您的数据一致性是关键是发现和使用!
数据管理计划(DMP)的一份文件,指出数据管理实践期间和之后一个特定的研究项目。他们通常与一个拨款提案写的。一般来说,DMP应包括所收集的数据的类型(s),数据格式(包括元数据),计划数据共享和数据保护的计划。(俄勒冈大学图书馆指南提供更多的细节信息,包括你的DMP)。
参考资料写DMP:
数据管理计划的最佳实践
参考资料写DMP:
- DMPTool:免费、在线资源,指导你通过写DMP的必要部分。它还提供了一个广泛的纯样品库(可下载)。
- 哥伦比亚大学数字研究中心和奖学金数据管理计划:自我评估提供了一个广泛的问题列表时要考虑编写一个DMP。
- ICPSR的创建一个数据管理计划的框架概述了许多推荐的DMP部分包括每个部分的示例文本。
数据管理计划的最佳实践
吉姆房龙
研究数据的图书管理员
jevanloon@www.zhongqiwg.com
248.370.2477
:几乎被任命
书的约会
你知道你的研究数据是很重要的。但研究数据管理为什么重要?
管理你的研究数据将帮助您:
管理你的研究数据将帮助您:
- 节省时间和资源
- 保护你的数据
- 维护数据完整性
- 满足批准的要求
- 促进新发现
- 支持开放获取
你的研究数据是有价值的(和其他人)生活之外的研究项目。数据保护策略可以帮助你确保访问你的数据。事实上,许多资助机构要求研究数据保存一定数量的年研究项目总结道。
数据保护是必要的一系列管理活动,确保持续访问数字材料只要必要的。(来源:国际联合会的数据组织)
使用一个数据存储库是一种理想的方式来确保您的数据保存。使用一些数据存储库的主要优势是,他们致力于研究数据的长期保存。这包括迁移文件格式、质量保证检查,提供高质量的存储和许多其他行动来确保你的研究发现和可用的数据。但并不是所有的数据存储库致力于长期保存。总是检查仓库存放数据之前的政策和程序。
最佳实践:
数据保护是必要的一系列管理活动,确保持续访问数字材料只要必要的。(来源:国际联合会的数据组织)
使用一个数据存储库是一种理想的方式来确保您的数据保存。使用一些数据存储库的主要优势是,他们致力于研究数据的长期保存。这包括迁移文件格式、质量保证检查,提供高质量的存储和许多其他行动来确保你的研究发现和可用的数据。但并不是所有的数据存储库致力于长期保存。总是检查仓库存放数据之前的政策和程序。
最佳实践:
- 总是保留数据,支持出版(s)或不能被复制。例如,一些民族志研究数据不能复制,因为它是与一个特定的时间或地点。
- 你不能保存所有的数据从您的研究项目。最好是宁可保存更多的数据比少但不要让一切。
- 一般来说,保持为5 - 10年的研究数据。十年后,检查如果数据仍然是必要的;如果没有,删除它。
- 使用非专利文件格式。非专有文件格式的例子包括:邮政、CSV、MOV, MP3, ASCII、TIFF、PDF和许多更多。使用这种类型的格式增加了机会,你(和其他人)能打开文件在稍后的日期。斯坦福大学图书馆有一个优秀的指南文件格式的最佳实践建议,包括非专利文件格式。
为什么共享数据?数据共享越来越成为规定机构、资助机构和出版商。分享你的研究数据有几个好处:
如何共享数据?
数据分享什么?你应该共享任何数据,支持出版物,如数据用来创建数据或表。然而,数据包含敏感信息或不应公开支持知识产权共享。
当共享数据?通常你应该分享你的数据是在刚出版的时候。但有些资助者和出版商在出版之前要求数据可用。
最佳实践:
- 增加研究影响和引用率
- 促进协作
- 减少冗余研究
- 增加再现性的研究
如何共享数据?
- 沉积在一个数据存储库:ICPSR,德律阿得斯等。注册表数据存储库的研究是一个可搜索的数据库1500多学科数据存储库。西蒙斯学院维护列表数据存储库的纪律。
- 发布的数据日报:期刊数据的例子:大自然的科学数据和研究数据为人文社会科学期刊。爱丁堡大学保持期刊的列表数据。
- 提交数据作为期刊文章的补充文件。检查《华尔街日报》的作者指南,看看这是一个选择。
数据分享什么?你应该共享任何数据,支持出版物,如数据用来创建数据或表。然而,数据包含敏感信息或不应公开支持知识产权共享。
当共享数据?通常你应该分享你的数据是在刚出版的时候。但有些资助者和出版商在出版之前要求数据可用。
最佳实践:
- 在分享之前,检查你不侵犯知识产权通过分享研究数据。例如,数据本身不受版权,但一个表达式的数据(例如一个表或数据库)版权。
- 如果可能的话,应用一个开放数据共享许可或者一个Creative Commons许可你的数据。这些许可证允许其他人员知道他们可以重用您的数据。