atgao/alpaca_gendered_filtered
收藏Hugging Face2024-05-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/atgao/alpaca_gendered_filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 46208623
num_examples: 52002
- name: augmented
num_bytes: 4606820
num_examples: 5512
- name: filtered
num_bytes: 5621035
num_examples: 5661
download_size: 29560447
dataset_size: 56436478
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: augmented
path: data/augmented-*
- split: filtered
path: data/filtered-*
---
提供机构:
atgao
原始信息汇总
数据集概述
数据集特征
- instruction:数据类型为字符串。
- input:数据类型为字符串。
- output:数据类型为字符串。
- text:数据类型为字符串。
数据集分割
- train:包含52002个样本,总大小为46208623字节。
- augmented:包含5512个样本,总大小为4606820字节。
- filtered:包含5661个样本,总大小为5621035字节。
数据集大小
- 下载大小:29560447字节。
- 数据集总大小:56436478字节。
配置文件
- 默认配置:包含训练、增强和过滤三个分割的数据文件路径。
- 训练数据:路径为
data/train-*。 - 增强数据:路径为
data/augmented-*。 - 过滤数据:路径为
data/filtered-*。
- 训练数据:路径为



