kenhktsui/falcon_subset_quality_score_v1
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/kenhktsui/falcon_subset_quality_score_v1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: meta
struct:
- name: source
dtype: string
- name: quality_score
dtype: float64
- name: registry
dtype: string
- name: registry_score
dtype: float64
- name: domain1
dtype: string
- name: domain_score1
dtype: float64
- name: domain2
dtype: string
- name: domain_score2
dtype: float64
- name: rating
dtype: string
- name: quality_score_v1
struct:
- name: label
dtype: string
- name: score
dtype: float32
splits:
- name: train
num_bytes: 3011072950
num_examples: 668977
download_size: 1830673223
dataset_size: 3011072950
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
kenhktsui
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- meta: 结构化数据,包含以下字段:
- source: 数据类型为字符串。
- quality_score: 数据类型为浮点数。
- registry: 数据类型为字符串。
- registry_score: 数据类型为浮点数。
- domain1: 数据类型为字符串。
- domain_score1: 数据类型为浮点数。
- domain2: 数据类型为字符串。
- domain_score2: 数据类型为浮点数。
- rating: 数据类型为字符串。
- quality_score_v1: 结构化数据,包含以下字段:
- label: 数据类型为字符串。
- score: 数据类型为浮点数。
数据集分割
- train:
- 数据大小: 3011072950 字节
- 示例数量: 668977
数据集大小
- 下载大小: 1830673223 字节
- 数据集总大小: 3011072950 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



