boda/cryptonite
收藏Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/boda/cryptonite
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
dataset_info:
features:
- name: publisher
dtype: string
- name: date
dtype: timestamp[ns]
- name: author
dtype: string
- name: orientation
dtype: string
- name: clue
dtype: string
- name: answer
dtype: string
- name: enumeration
dtype: string
- name: quick
dtype: bool
- name: sub_publisher
dtype: string
splits:
- name: train
num_bytes: 51949570
num_examples: 470804
- name: val
num_bytes: 2886129
num_examples: 26156
- name: test
num_bytes: 2891443
num_examples: 26157
download_size: 26277347
dataset_size: 57727142
---
# Dataset Card for "cryptonite"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default(默认配置)
数据文件:
- 拆分(split):训练集,路径:data/train-*
- 拆分(split):验证集,路径:data/val-*
- 拆分(split):测试集,路径:data/test-*
数据集信息:
特征项:
- 名称:publisher(出版方),数据类型:字符串
- 名称:date(日期),数据类型:纳秒级时间戳(timestamp[ns])
- 名称:author(作者),数据类型:字符串
- 名称:orientation(立场倾向),数据类型:字符串
- 名称:clue(线索),数据类型:字符串
- 名称:answer(答案),数据类型:字符串
- 名称:enumeration(枚举条目),数据类型:字符串
- 名称:quick(快速标记),数据类型:布尔值(bool)
- 名称:sub_publisher(子出版方),数据类型:字符串
拆分详情:
- 名称:train(训练集),字节数:51949570,样本量:470804
- 名称:val(验证集),字节数:2886129,样本量:26156
- 名称:test(测试集),字节数:2891443,样本量:26157
下载大小:26277347
数据集总大小:57727142
---
# 「cryptonite」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
boda
原始信息汇总
数据集概述
配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 验证集 (
val):data/val-* - 测试集 (
test):data/test-*
- 训练集 (
- 数据文件路径:
数据集信息
特征
publisher: 字符串类型date: 时间戳类型 (纳秒精度)author: 字符串类型orientation: 字符串类型clue: 字符串类型answer: 字符串类型enumeration: 字符串类型quick: 布尔类型sub_publisher: 字符串类型
数据分割
- 训练集 (
train)- 字节数: 51949570
- 样本数: 470804
- 验证集 (
val)- 字节数: 2886129
- 样本数: 26156
- 测试集 (
test)- 字节数: 2891443
- 样本数: 26157
数据集大小
- 下载大小: 26277347 字节
- 数据集大小: 57727142 字节



