five

Crossref Works Dump - April 2018

收藏
Figshare2018-04-23 更新2026-04-08 收录
下载链接:
https://figshare.com/articles/Crossref_Works_Dump_-_April_2018/6170414/1
下载链接
链接失效反馈
官方服务:
资源简介:
An effort by eLife Sciences to make citation data more accessible.http://elifesciences.org/<br>This dump provides the raw Crossref works JSON responses as a bulk dump, downloaded in April 2018.<br>It was created by retrieving the works from Crossref API http://api.crossref.org/works (using a 1000 rows per page and a cursor).<br>The source code that produced the file can be found here:https://github.com/elifesciences/datacapsule-crossref<br>The output is a 32 GB zip file (using LZMA encryption) contains all of the Crossref raw response. In this case some manuscripts received updates during the download process and therefore will appear twice.<br>To uncompress the file you will need a tool that can handle LZMA (Python 3's zipfile can for example, so can 7zip).<br>The aforementioned project (datacapsule-crossref) also includes code that extracts information from JSON responses included in the zip.

本项目由eLife Sciences发起,旨在提升学术引用数据的可访问性,相关详情可访问:http://elifesciences.org/ 本批量转储包包含2018年4月下载的Crossref文献条目原始JSON响应内容。 本转储包通过从Crossref应用程序编程接口(Application Programming Interface,API,http://api.crossref.org/works)拉取文献数据生成,拉取时采用每页1000条结果及游标分页的方式。 生成该转储包文件的源代码可访问于:https://github.com/elifesciences/datacapsule-crossref 输出结果为一个大小32GB的LZMA加密ZIP压缩包,内含所有Crossref文献条目原始响应数据。由于部分稿件在下载过程中发生了更新,因此会出现重复条目。 解压该文件需使用支持LZMA算法的工具,例如Python 3的zipfile模块或7-Zip。 前述datacapsule-crossref项目同样包含可从压缩包内的JSON响应数据中提取信息的代码。
创建时间:
2018-04-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作