five

Yamei/VISBank_Final

收藏
Hugging Face2023-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yamei/VISBank_Final
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: title dtype: string - name: paper_id dtype: int64 - name: abstract dtype: string - name: authors list: - name: first dtype: string - name: middle sequence: string - name: last dtype: string - name: suffix dtype: string - name: year dtype: float64 - name: arxiv_id dtype: string - name: acl_id dtype: string - name: pmc_id dtype: string - name: pubmed_id dtype: string - name: doi dtype: string - name: venue dtype: string - name: journal dtype: string - name: mag_id dtype: string - name: outbound_citations sequence: string - name: inbound_citations sequence: string - name: has_outbound_citations dtype: bool - name: has_inbound_citations dtype: bool - name: has_pdf_parse dtype: bool - name: s2_url dtype: string - name: has_pdf_body_text dtype: float64 - name: has_pdf_parsed_abstract dtype: float64 - name: has_pdf_parsed_body_text dtype: float64 - name: has_pdf_parsed_bib_entries dtype: float64 - name: has_pdf_parsed_ref_entries dtype: float64 - name: entities sequence: sequence: string splits: - name: train num_bytes: 254427395 num_examples: 125745 download_size: 133946624 dataset_size: 254427395 --- # Dataset Card for "VISBank_CleaneParsed" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- dataset_info: features: - name: 标题(title) dtype: 字符串(string) - name: 论文ID(paper_id) dtype: 64位整数(int64) - name: 摘要(abstract) dtype: 字符串(string) - name: 作者信息(authors) list: - name: 名字(first) dtype: 字符串(string) - name: 中间名序列(middle) sequence: string - name: 姓氏(last) dtype: 字符串(string) - name: 姓名后缀(suffix) dtype: 字符串(string) - name: 发表年份(year) dtype: 64位浮点数(float64) - name: arXiv编号(arxiv_id) dtype: 字符串(string) - name: ACL编号(acl_id) dtype: 字符串(string) - name: PubMed Central编号(pmc_id) dtype: 字符串(string) - name: PubMed编号(pubmed_id) dtype: 字符串(string) - name: 数字对象标识符(doi, Digital Object Identifier) dtype: 字符串(string) - name: 发表场所(venue) dtype: 字符串(string) - name: 期刊(journal) dtype: 字符串(string) - name: MAG编号(mag_id) dtype: 字符串(string) - name: 出站引用列表(outbound_citations) sequence: string - name: 入站引用列表(inbound_citations) sequence: string - name: 是否存在出站引用(has_outbound_citations) dtype: 布尔值(bool) - name: 是否存在入站引用(has_inbound_citations) dtype: 布尔值(bool) - name: 是否完成PDF解析(has_pdf_parse) dtype: 布尔值(bool) - name: S2链接(s2_url) dtype: 字符串(string) - name: 是否包含PDF正文文本(has_pdf_body_text) dtype: 64位浮点数(float64) - name: 是否包含解析后的PDF摘要(has_pdf_parsed_abstract) dtype: 64位浮点数(float64) - name: 是否包含解析后的PDF正文(has_pdf_parsed_body_text) dtype: 64位浮点数(float64) - name: 是否包含解析后的PDF参考文献条目(has_pdf_parsed_bib_entries) dtype: 64位浮点数(float64) - name: 是否包含解析后的PDF引用条目(has_pdf_parsed_ref_entries) dtype: 64位浮点数(float64) - name: 实体序列(entities) sequence: sequence: string splits: - name: 训练集(train) num_bytes: 254427395 num_examples: 125745 download_size: 133946624 dataset_size: 254427395 --- # 「VISBank_CleaneParsed」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Yamei
原始信息汇总

数据集概述

数据集名称

  • 名称: VISBank_CleaneParsed

数据集特征

  • title: 字符串类型
  • paper_id: 整数类型
  • abstract: 字符串类型
  • authors: 列表类型,包含以下子特征:
    • first: 字符串类型
    • middle: 序列类型,字符串类型
    • last: 字符串类型
    • suffix: 字符串类型
  • year: 浮点数类型
  • arxiv_id: 字符串类型
  • acl_id: 字符串类型
  • pmc_id: 字符串类型
  • pubmed_id: 字符串类型
  • doi: 字符串类型
  • venue: 字符串类型
  • journal: 字符串类型
  • mag_id: 字符串类型
  • outbound_citations: 序列类型,字符串类型
  • inbound_citations: 序列类型,字符串类型
  • has_outbound_citations: 布尔类型
  • has_inbound_citations: 布尔类型
  • has_pdf_parse: 布尔类型
  • s2_url: 字符串类型
  • has_pdf_body_text: 浮点数类型
  • has_pdf_parsed_abstract: 浮点数类型
  • has_pdf_parsed_body_text: 浮点数类型
  • has_pdf_parsed_bib_entries: 浮点数类型
  • has_pdf_parsed_ref_entries: 浮点数类型
  • entities: 序列类型,包含序列类型,字符串类型

数据集分割

  • train:
    • num_bytes: 254427395
    • num_examples: 125745

数据集大小

  • download_size: 133946624
  • dataset_size: 254427395
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作