aptl26/wmdp_deduped_corpora
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/aptl26/wmdp_deduped_corpora
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文本、分割、原始问题、正确答案和错误答案。数据集被分割成多个部分,每个部分都有对应的字节大小和示例数量。数据集的下载大小为1351195字节,数据集大小为3856240字节。
The dataset contains multiple features such as text, split, original question, correct answer, and wrong answers. The dataset is divided into several parts, each with corresponding byte sizes and example counts. The download size of the dataset is 1351195 bytes, and the dataset size is 3856240 bytes.
提供机构:
aptl26
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- split: 数据类型为字符串。
- original_question: 数据类型为字符串。
- correct_answer: 数据类型为字符串。
- wrong_answers: 数据类型为字符串序列。
数据集分割
- whp_corpus__split_3: 包含423个样本,占用241958字节。
- whp_corpus__dev: 包含13个样本,占用7723字节。
- whp_corpus__split_1: 包含419个样本,占用229234字节。
- whp_corpus__split_4: 包含415个样本,占用236938字节。
- whp_corpus__split_2: 包含414个样本,占用228766字节。
- whp_corpus__split_0: 包含418个样本,占用224778字节。
- corpus__split_2: 包含471个样本,占用271820字节。
- corpus__split_1: 包含471个样本,占用272090字节。
- corpus__split_4: 包含471个样本,占用276496字节。
- corpus__split_3: 包含471个样本,占用277550字节。
- corpus__dev: 包含15个样本,占用10526字节。
- corpus__split_0: 包含471个样本,占用266501字节。
- fwf_corpus__split_0: 包含471个样本,占用253593字节。
- fwf_corpus__dev: 包含15个样本,占用9067字节。
- fwf_corpus__split_2: 包含471个样本,占用262048字节。
- fwf_corpus__split_1: 包含471个样本,占用257717字节。
- fwf_corpus__split_3: 包含471个样本,占用262205字节。
- fwf_corpus__split_4: 包含471个样本,占用267230字节。
数据集大小
- 下载大小: 1351195字节。
- 数据集总大小: 3856240字节。
配置
- config_name: default
- 数据文件路径:
- whp_corpus__split_3: data/whp_corpus__split_3-*
- whp_corpus__dev: data/whp_corpus__dev-*
- whp_corpus__split_1: data/whp_corpus__split_1-*
- whp_corpus__split_4: data/whp_corpus__split_4-*
- whp_corpus__split_2: data/whp_corpus__split_2-*
- whp_corpus__split_0: data/whp_corpus__split_0-*
- corpus__split_2: data/corpus__split_2-*
- corpus__split_1: data/corpus__split_1-*
- corpus__split_4: data/corpus__split_4-*
- corpus__split_3: data/corpus__split_3-*
- corpus__dev: data/corpus__dev-*
- corpus__split_0: data/corpus__split_0-*
- fwf_corpus__split_0: data/fwf_corpus__split_0-*
- fwf_corpus__dev: data/fwf_corpus__dev-*
- fwf_corpus__split_2: data/fwf_corpus__split_2-*
- fwf_corpus__split_1: data/fwf_corpus__split_1-*
- fwf_corpus__split_3: data/fwf_corpus__split_3-*
- fwf_corpus__split_4: data/fwf_corpus__split_4-*
- 数据文件路径:



