Dmitriy007/Socrat
收藏Hugging Face2023-03-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Dmitriy007/Socrat
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: input_ids
sequence: int32
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 37517232.0
num_examples: 11994
- name: val
num_bytes: 6621976.0
num_examples: 2117
download_size: 16725921
dataset_size: 44139208.0
---
# Dataset Card for "Socrat"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:输入Token ID序列(input_ids),类型为序列,元素为int32整数
- 名称:标签序列(labels),类型为序列,元素为int64整数
数据集划分:
- 划分名称:训练集(train),占用字节数:37517232.0,样本量:11994
- 划分名称:验证集(val),占用字节数:6621976.0,样本量:2117
下载大小:16725921 字节
数据集总大小:44139208.0 字节
# "Socrat" 数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Dmitriy007
原始信息汇总
数据集概述
数据集特征
- input_ids:序列类型为
int32。 - labels:序列类型为
int64。
数据集划分
- 训练集(train):包含
11994个样本,占用空间37517232.0字节。 - 验证集(val):包含
2117个样本,占用空间6621976.0字节。
数据集大小
- 下载大小:
16725921字节。 - 总数据集大小:
44139208.0字节。



