konwoo/dclm-164k-real-train-8b-instruct-hq-cpr32-ml1024
收藏Hugging Face2026-02-02 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/konwoo/dclm-164k-real-train-8b-instruct-hq-cpr32-ml1024
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: text
dtype: string
- name: doc_text
dtype: string
- name: logprob
dtype: 'null'
splits:
- name: train
num_bytes: 48514136378
num_examples: 5248000
download_size: 15908964929
dataset_size: 48514136378
---
数据集配置:
- 配置名称:default
数据文件列表:
- 数据拆分:train(训练集)
数据路径:data/train-*
数据集信息:
数据集特征:
- 特征名称:text(文本),数据类型:字符串(string)
- 特征名称:doc_text(文档文本),数据类型:字符串(string)
- 特征名称:logprob(对数概率),数据类型:空类型(null)
数据拆分统计:
- 拆分名称:train,总字节数:48514136378,样本总数:5248000
下载总大小:15908964929
数据集总存储大小:48514136378
提供机构:
konwoo



