mugeakbulut/Kadi_Sicilleri-ds-mini
收藏Hugging Face2023-12-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mugeakbulut/Kadi_Sicilleri-ds-mini
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了论文的基本信息、提交历史、评论、主题、期刊引用等内容。数据集字段包括DOCNO、ARXIVID_xml、ARXIVID、Link、Title、Authors、Year、Submitted on、Submission history、Last revised tarihi、content、Comments、Subject、Journal reference、DOI、Cite as等。数据集分为训练集和验证集,训练集包含413个样本,验证集包含46个样本,数据集总大小为1652412.0字节。
该数据集包含了论文的基本信息、提交历史、评论、主题、期刊引用等内容。数据集字段包括DOCNO、ARXIVID_xml、ARXIVID、Link、Title、Authors、Year、Submitted on、Submission history、Last revised tarihi、content、Comments、Subject、Journal reference、DOI、Cite as等。数据集分为训练集和验证集,训练集包含413个样本,验证集包含46个样本,数据集总大小为1652412.0字节。
提供机构:
mugeakbulut
原始信息汇总
数据集概述
数据集特征
- DOCNO: 数据类型为
int64 - ARXIVID_xml: 数据类型为
string - ARXIVID: 数据类型为
string - Link: 数据类型为
string - Title: 数据类型为
string - Authors: 数据类型为
string - Year: 数据类型为
int64 - Submitted on (gün, ay, yıl olarak submission tarihi): 数据类型为
string - Submission history (v1 de dahil olmak üzere hepsi): 数据类型为
string - Last revised tarihi: 数据类型为
string - content: 数据类型为
string - Comments: 数据类型为
string - Subject: 数据类型为
string - Journal reference: 数据类型为
string - DOI: 数据类型为
string - Cite as: 数据类型为
string - Unnamed: 16: 数据类型为
float64 - Unnamed: 17: 数据类型为
float64 - Unnamed: 18: 数据类型为
float64 - Unnamed: 19: 数据类型为
float64 - Unnamed: 20: 数据类型为
string - Abstract_no: 数据类型为
string - Unnamed: 22: 数据类型为
string - review: 数据类型为
string - content_length: 数据类型为
int64
数据集分割
- train: 包含 413 个样本,占用 1486810.797385621 字节
- validation: 包含 46 个样本,占用 165601.2026143791 字节
数据集大小
- 下载大小: 810073 字节
- 数据集大小: 1652412.0 字节
配置
- default 配置包含以下数据文件:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为



