Yamei/VISBank_Final
收藏Hugging Face2023-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yamei/VISBank_Final
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: title
dtype: string
- name: paper_id
dtype: int64
- name: abstract
dtype: string
- name: authors
list:
- name: first
dtype: string
- name: middle
sequence: string
- name: last
dtype: string
- name: suffix
dtype: string
- name: year
dtype: float64
- name: arxiv_id
dtype: string
- name: acl_id
dtype: string
- name: pmc_id
dtype: string
- name: pubmed_id
dtype: string
- name: doi
dtype: string
- name: venue
dtype: string
- name: journal
dtype: string
- name: mag_id
dtype: string
- name: outbound_citations
sequence: string
- name: inbound_citations
sequence: string
- name: has_outbound_citations
dtype: bool
- name: has_inbound_citations
dtype: bool
- name: has_pdf_parse
dtype: bool
- name: s2_url
dtype: string
- name: has_pdf_body_text
dtype: float64
- name: has_pdf_parsed_abstract
dtype: float64
- name: has_pdf_parsed_body_text
dtype: float64
- name: has_pdf_parsed_bib_entries
dtype: float64
- name: has_pdf_parsed_ref_entries
dtype: float64
- name: entities
sequence:
sequence: string
splits:
- name: train
num_bytes: 254427395
num_examples: 125745
download_size: 133946624
dataset_size: 254427395
---
# Dataset Card for "VISBank_CleaneParsed"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
dataset_info:
features:
- name: 标题(title)
dtype: 字符串(string)
- name: 论文ID(paper_id)
dtype: 64位整数(int64)
- name: 摘要(abstract)
dtype: 字符串(string)
- name: 作者信息(authors)
list:
- name: 名字(first)
dtype: 字符串(string)
- name: 中间名序列(middle)
sequence: string
- name: 姓氏(last)
dtype: 字符串(string)
- name: 姓名后缀(suffix)
dtype: 字符串(string)
- name: 发表年份(year)
dtype: 64位浮点数(float64)
- name: arXiv编号(arxiv_id)
dtype: 字符串(string)
- name: ACL编号(acl_id)
dtype: 字符串(string)
- name: PubMed Central编号(pmc_id)
dtype: 字符串(string)
- name: PubMed编号(pubmed_id)
dtype: 字符串(string)
- name: 数字对象标识符(doi, Digital Object Identifier)
dtype: 字符串(string)
- name: 发表场所(venue)
dtype: 字符串(string)
- name: 期刊(journal)
dtype: 字符串(string)
- name: MAG编号(mag_id)
dtype: 字符串(string)
- name: 出站引用列表(outbound_citations)
sequence: string
- name: 入站引用列表(inbound_citations)
sequence: string
- name: 是否存在出站引用(has_outbound_citations)
dtype: 布尔值(bool)
- name: 是否存在入站引用(has_inbound_citations)
dtype: 布尔值(bool)
- name: 是否完成PDF解析(has_pdf_parse)
dtype: 布尔值(bool)
- name: S2链接(s2_url)
dtype: 字符串(string)
- name: 是否包含PDF正文文本(has_pdf_body_text)
dtype: 64位浮点数(float64)
- name: 是否包含解析后的PDF摘要(has_pdf_parsed_abstract)
dtype: 64位浮点数(float64)
- name: 是否包含解析后的PDF正文(has_pdf_parsed_body_text)
dtype: 64位浮点数(float64)
- name: 是否包含解析后的PDF参考文献条目(has_pdf_parsed_bib_entries)
dtype: 64位浮点数(float64)
- name: 是否包含解析后的PDF引用条目(has_pdf_parsed_ref_entries)
dtype: 64位浮点数(float64)
- name: 实体序列(entities)
sequence:
sequence: string
splits:
- name: 训练集(train)
num_bytes: 254427395
num_examples: 125745
download_size: 133946624
dataset_size: 254427395
---
# 「VISBank_CleaneParsed」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Yamei
原始信息汇总
数据集概述
数据集名称
- 名称: VISBank_CleaneParsed
数据集特征
- title: 字符串类型
- paper_id: 整数类型
- abstract: 字符串类型
- authors: 列表类型,包含以下子特征:
- first: 字符串类型
- middle: 序列类型,字符串类型
- last: 字符串类型
- suffix: 字符串类型
- year: 浮点数类型
- arxiv_id: 字符串类型
- acl_id: 字符串类型
- pmc_id: 字符串类型
- pubmed_id: 字符串类型
- doi: 字符串类型
- venue: 字符串类型
- journal: 字符串类型
- mag_id: 字符串类型
- outbound_citations: 序列类型,字符串类型
- inbound_citations: 序列类型,字符串类型
- has_outbound_citations: 布尔类型
- has_inbound_citations: 布尔类型
- has_pdf_parse: 布尔类型
- s2_url: 字符串类型
- has_pdf_body_text: 浮点数类型
- has_pdf_parsed_abstract: 浮点数类型
- has_pdf_parsed_body_text: 浮点数类型
- has_pdf_parsed_bib_entries: 浮点数类型
- has_pdf_parsed_ref_entries: 浮点数类型
- entities: 序列类型,包含序列类型,字符串类型
数据集分割
- train:
- num_bytes: 254427395
- num_examples: 125745
数据集大小
- download_size: 133946624
- dataset_size: 254427395



