pwc-archive/links-between-paper-and-code
收藏Hugging Face2025-09-10 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/pwc-archive/links-between-paper-and-code
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: paper_url
dtype: string
- name: paper_title
dtype: string
- name: paper_arxiv_id
dtype: string
- name: paper_url_abs
dtype: string
- name: paper_url_pdf
dtype: string
- name: repo_url
dtype: string
- name: is_official
dtype: bool
- name: mentioned_in_paper
dtype: bool
- name: mentioned_in_github
dtype: bool
- name: framework
dtype: string
splits:
- name: train
num_bytes: 92630900
num_examples: 300161
download_size: 41364239
dataset_size: 92630900
---
> [!CAUTION]
> This dataset will not be updated. It corresponds to the last available public snapshot of the data, retrieved on July 28th, 2025.
>
---
许可证:知识共享署名-相同方式共享4.0协议(CC BY-SA 4.0)
数据集配置项:
- 配置名称:默认
数据文件:
- 数据划分:训练集
路径:data/train-*
数据集信息:
特征字段:
- 名称:论文链接(paper_url),数据类型:字符串
- 名称:论文标题(paper_title),数据类型:字符串
- 名称:论文arXiv编号(paper_arxiv_id),数据类型:字符串
- 名称:论文摘要页链接(paper_url_abs),数据类型:字符串
- 名称:论文PDF链接(paper_url_pdf),数据类型:字符串
- 名称:代码仓库链接(repo_url),数据类型:字符串
- 名称:是否为官方仓库(is_official),数据类型:布尔值
- 名称:论文中提及(mentioned_in_paper),数据类型:布尔值
- 名称:GitHub中提及(mentioned_in_github),数据类型:布尔值
- 名称:开发框架(framework),数据类型:字符串
数据划分:
- 划分名称:训练集
占用字节数:92630900
样本数量:300161
下载大小:41364239
数据集总大小:92630900
---
> [!注意事项]
> 本数据集将不再进行更新,其对应于2025年7月28日获取的最后一份可用公开数据快照。
提供机构:
pwc-archive



