我们非常高兴地宣布ARCH(档案研究计算中心)正式向公众开放。这是一项全新的研究和教育服务,旨在帮助用户轻松地构建、访问和分析大规模数字馆藏。ARCH 融合了互联网档案馆十多年来通过向研究人员提供大规模数据以及 ARS(Archive-it 研究服务)等面向数据集的服务集成来支持计算研究的经验,并与滑铁卢大学和约克大学的“Archives Unleashed”项目合作。ARCH 的开发得到了梅隆基金会的慷慨支持。
ARCH 仪表板
ARCH 起什么作用?
ARCH 帮助用户轻松开展并支持大规模数字馆藏的计算研究,例如文本和数据挖掘、数据科学、数字学术研究、机器学习等。用户可以构建与广泛主题相关的自定义研究馆藏,从馆藏中生成和访问可用于研究的数据集,并对这 海外数据 些数据集进行分析。ARCH 秉承可重复性的最佳实践,支持用户生成数据集的公开发布和保存。ARCH 目前已针对数以万计的网络档案馆藏进行了优化,涵盖广泛的主题、事件和时间范围,并且该平台正在积极扩展以涵盖数字化文本和图像馆藏。ARCH 还与 Wayback Machine 全球网络档案库的各个部分合作,该档案库总计超过 50PB,最早可追溯至 1996 年,是当代历史和通信领域的海量档案。
ARCH,浏览器内可视化
ARCH 适合谁?
ARCH 适用于任何寻求以便捷方式大规模处理数字馆藏的用户。潜在用户包括但不限于:探索学科问题的研究人员、寻求在课堂上培养计算方法的教育工作者、追踪网络传播随时间变化的记者,以及寻求支持跨学科计算素养发展的图书馆员和档案管理员。近期利用 ARCH 的研究工作包括但不限于:分析 COVID-19 危机传播、健康错误信息、拉丁美洲妇女权利运动以及冲突后社会的和解进程。
ARCH,生成数据集
ARCH 的核心功能是什么?
构建:利用 ARCH 功能构建适用于特定研究和教育目的的定制研究集合。
访问:只需点击按钮,即可从数字馆藏中生成十几种不同的研究级数据集(例如,全文、图像、PDF、图表数据等)。可直接在浏览器中或通过 API 下载生成的数据集。
分析:轻松在交互式计算环境和应用程序(如 Jupyter Notebooks、Google CoLab、Gephi 和 Voyant)中处理可用于研究的数据集,并在浏览器中生成可视化效果。
发布与保存:公开发布符合可重复研究最佳实践的数据集。所有已发布的数据集将永久保存。
支持:利用同步和异步技术支持、在线培训和广泛的帮助中心文档。
我如何才能了解有关 ARCH 的更多信息?
要了解有关 ARCH 的更多信息,请通过以下表格联系我们。
构建、访问、分析:ARCH(档案研究计算中心)简介
-
- Posts: 1251
- Joined: Tue Dec 24, 2024 4:26 am