Fredithefish/dcln-subset-70gb
收藏Hugging Face2026-03-23 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Fredithefish/dcln-subset-70gb
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: url
dtype: string
- name: id
dtype: string
- name: language
dtype: string
- name: language_score
dtype: float32
- name: fasttext_score
dtype: float32
splits:
- name: test
num_bytes: 5438293
num_examples: 1000
download_size: 3199603
dataset_size: 5438293
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 字段名: text
数据类型: 字符串(string)
- 字段名: url
数据类型: 字符串(string)
- 字段名: id
数据类型: 字符串(string)
- 字段名: language
数据类型: 字符串(string)
- 字段名: language_score
数据类型: 32位浮点型(float32)
- 字段名: fasttext_score
数据类型: 32位浮点型(float32)
数据集划分:
- 划分名称: 测试集(test)
字节数: 5438293
样本数量: 1000
下载大小: 3199603
数据集总大小: 5438293
配置项:
- 配置名称: 默认配置(default)
数据文件:
- 对应划分: 测试集(test)
路径: data/test-*
提供机构:
Fredithefish



