AlekseyKorshuk/clean-dataset-preview-zero
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AlekseyKorshuk/clean-dataset-preview-zero
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: message_id
dtype: string
- name: model_input
dtype: string
- name: response
dtype: string
- name: edited_response
dtype: string
- name: user_id
dtype: string
- name: check_nsfw_words_criteria
dtype: float64
splits:
- name: train
num_bytes: 115524003.7411831
num_examples: 50510
download_size: 45480394
dataset_size: 115524003.7411831
---
# Dataset Card for "clean-dataset-preview-zero"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息(dataset_info):
特征字段:
- 名称:消息ID(message_id),数据类型:字符串(string)
- 名称:模型输入(model_input),数据类型:字符串(string)
- 名称:回复内容(response),数据类型:字符串(string)
- 名称:编辑后回复(edited_response),数据类型:字符串(string)
- 名称:用户ID(user_id),数据类型:字符串(string)
- 名称:NSFW词汇检测标准(check_nsfw_words_criteria),数据类型:64位浮点数(float64)
数据划分:
- 划分名称:训练集(train),字节大小:115524003.7411831,样本数量:50510
下载大小:45480394
数据集总大小:115524003.7411831
---
# 「clean-dataset-preview-zero」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
AlekseyKorshuk
原始信息汇总
数据集概述
数据集名称
clean-dataset-preview-zero
数据结构
特征(Features)
- message_id:数据类型为字符串(string)。
- model_input:数据类型为字符串(string)。
- response:数据类型为字符串(string)。
- edited_response:数据类型为字符串(string)。
- user_id:数据类型为字符串(string)。
- check_nsfw_words_criteria:数据类型为浮点数(float64)。
数据分割(Splits)
- train:包含50510个样本,总大小为115524003.7411831字节。
数据集大小
- 下载大小:45480394字节。
- 数据集总大小:115524003.7411831字节。



