joey234/mmlu-machine_learning-neg-prepend
收藏Hugging Face2023-08-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joey234/mmlu-machine_learning-neg-prepend
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: choices
sequence: string
- name: answer
dtype:
class_label:
names:
'0': A
'1': B
'2': C
'3': D
- name: negate_openai_prompt
struct:
- name: content
dtype: string
- name: role
dtype: string
- name: neg_question
dtype: string
- name: fewshot_context
dtype: string
- name: ori_prompt
dtype: string
- name: neg_prompt
dtype: string
- name: fewshot_context_neg
dtype: string
- name: fewshot_context_ori
dtype: string
splits:
- name: dev
num_bytes: 10794
num_examples: 5
- name: test
num_bytes: 1393778
num_examples: 112
download_size: 125761
dataset_size: 1404572
configs:
- config_name: default
data_files:
- split: dev
path: data/dev-*
- split: test
path: data/test-*
---
# Dataset Card for "mmlu-machine_learning-neg-prepend"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
## 数据集信息
### 数据特征
1. `question`:数据类型为字符串(string),用于存储题目内容
2. `choices`:数据类型为字符串序列(sequence of string),用于存储题目选项列表
3. `answer`:数据类型为分类标签(class_label),类别名称映射关系为:`0`对应A、`1`对应B、`2`对应C、`3`对应D
4. `negate_openai_prompt`:结构体(struct)类型,包含两个子字段:
- `content`:字符串类型,存储提示词内容
- `role`:字符串类型,存储提示词对应的角色
5. `neg_question`:字符串类型,存储否定式题目
6. `fewshot_context`:字符串类型,存储少样本上下文
7. `ori_prompt`:字符串类型,存储原始提示词
8. `neg_prompt`:字符串类型,存储否定式提示词
9. `fewshot_context_neg`:字符串类型,存储否定式少样本上下文
10. `fewshot_context_ori`:字符串类型,存储原始少样本上下文
### 数据划分
- 开发集(dev):数据字节数10794,样本数量5
- 测试集(test):数据字节数1393778,样本数量112
- 下载总大小:125761字节
- 数据集总大小:1404572字节
### 数据集配置
- 配置名称:default(默认配置)
- 数据文件映射规则:
- 开发集(dev)对应路径为`data/dev-*`
- 测试集(test)对应路径为`data/test-*`
---
# 数据集卡片:"mmlu-machine_learning-neg-prepend"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
joey234
原始信息汇总
数据集概述
数据集名称
mmlu-machine_learning-neg-prepend
数据集特征
- question: 数据类型为字符串。
- choices: 数据类型为字符串序列。
- answer: 数据类型为分类标签,标签名分别为A、B、C、D。
- negate_openai_prompt: 结构化数据,包含
content和role,两者数据类型均为字符串。 - neg_question: 数据类型为字符串。
- fewshot_context: 数据类型为字符串。
- ori_prompt: 数据类型为字符串。
- neg_prompt: 数据类型为字符串。
- fewshot_context_neg: 数据类型为字符串。
- fewshot_context_ori: 数据类型为字符串。
数据集分割
- dev: 大小为10794字节,包含5个样本。
- test: 大小为1393778字节,包含112个样本。
数据集大小
- 下载大小: 125761字节
- 数据集总大小: 1404572字节
配置文件
- config_name: default
- data_files:
- dev: 路径为
data/dev-* - test: 路径为
data/test-*
- dev: 路径为



