SaffalPoosh/masking_dataset
收藏Hugging Face2024-06-29 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/SaffalPoosh/masking_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:origignal_text和masked_text,均为字符串类型。数据集分为训练集、测试集和验证集,分别包含503、1247和3902个样本。总下载大小为860612字节,数据集总大小为1208296字节。
This dataset includes two main features: original text and masked text, divided into three splits: train, test, and validation. The train split contains 503 samples with a total of 105504 bytes; the test split contains 1247 samples with a total of 270062 bytes; the validation split contains 3902 samples with a total of 832730 bytes. The total download size of the dataset is 860612 bytes, and the actual size is 1208296 bytes.
提供机构:
SaffalPoosh
原始信息汇总
数据集概述
数据集特征
- origignal_text: 类型为字符串。
- masked_text: 类型为字符串。
数据集划分
- train: 包含503个样本,占用105504字节。
- test: 包含1247个样本,占用270062字节。
- validation: 包含3902个样本,占用832730字节。
数据集大小
- 下载大小: 860612字节。
- 总大小: 1208296字节。
配置
- default:
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。 - validation: 数据路径为
data/validation-*。
- train: 数据路径为



