MoritzLaurer/zeroshot_test_downsampled
收藏Hugging Face2024-03-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/zeroshot_test_downsampled
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: hypothesis
dtype: string
- name: labels
dtype:
class_label:
names:
'0': entailment
'1': not_entailment
- name: task_name
dtype: string
- name: label_text
dtype: string
splits:
- name: mnli_m
num_bytes: 2055427
num_examples: 9815
- name: mnli_mm
num_bytes: 2181179
num_examples: 9832
- name: fevernli
num_bytes: 7532028
num_examples: 19652
- name: anli_r1
num_bytes: 433064
num_examples: 1000
- name: anli_r2
num_bytes: 432927
num_examples: 1000
- name: anli_r3
num_bytes: 501290
num_examples: 1200
- name: wanli
num_bytes: 940472
num_examples: 5000
- name: lingnli
num_bytes: 1078241
num_examples: 4893
- name: wellformedquery
num_bytes: 274932
num_examples: 2000
- name: rottentomatoes
num_bytes: 463520
num_examples: 2000
- name: amazonpolarity
num_bytes: 1073968
num_examples: 2000
- name: imdb
num_bytes: 2807450
num_examples: 2006
- name: yelpreviews
num_bytes: 1581332
num_examples: 2000
- name: hatexplain
num_bytes: 709210
num_examples: 2910
- name: massive
num_bytes: 23680622
num_examples: 172492
- name: banking77
num_bytes: 40009400
num_examples: 221760
- name: emotiondair
num_bytes: 1902532
num_examples: 10344
- name: emocontext
num_bytes: 880077
num_examples: 5340
- name: empathetic
num_bytes: 52141900
num_examples: 81344
- name: agnews
num_bytes: 2544632
num_examples: 8000
- name: yahootopics
num_bytes: 34686310
num_examples: 50000
- name: biasframes_sex
num_bytes: 314648
num_examples: 1510
- name: biasframes_offensive
num_bytes: 465662
num_examples: 2000
- name: biasframes_intent
num_bytes: 438394
num_examples: 2000
- name: financialphrasebank
num_bytes: 515448
num_examples: 2070
- name: appreviews
num_bytes: 604460
num_examples: 2000
- name: hateoffensive
num_bytes: 495508
num_examples: 2586
- name: trueteacher
num_bytes: 2783064
num_examples: 2000
- name: spam
num_bytes: 181876
num_examples: 1262
- name: wikitoxic_toxicaggregated
num_bytes: 923604
num_examples: 2000
- name: wikitoxic_obscene
num_bytes: 894472
num_examples: 2000
- name: wikitoxic_identityhate
num_bytes: 1010608
num_examples: 2000
- name: wikitoxic_threat
num_bytes: 725658
num_examples: 1422
- name: wikitoxic_insult
num_bytes: 833066
num_examples: 2000
- name: manifesto
num_bytes: 300869505
num_examples: 685720
- name: capsotu
num_bytes: 23150995
num_examples: 66444
download_size: 26325656
dataset_size: 512117481
configs:
- config_name: default
data_files:
- split: mnli_m
path: data/mnli_m-*
- split: mnli_mm
path: data/mnli_mm-*
- split: fevernli
path: data/fevernli-*
- split: anli_r1
path: data/anli_r1-*
- split: anli_r2
path: data/anli_r2-*
- split: anli_r3
path: data/anli_r3-*
- split: wanli
path: data/wanli-*
- split: lingnli
path: data/lingnli-*
- split: wellformedquery
path: data/wellformedquery-*
- split: rottentomatoes
path: data/rottentomatoes-*
- split: amazonpolarity
path: data/amazonpolarity-*
- split: imdb
path: data/imdb-*
- split: yelpreviews
path: data/yelpreviews-*
- split: hatexplain
path: data/hatexplain-*
- split: massive
path: data/massive-*
- split: banking77
path: data/banking77-*
- split: emotiondair
path: data/emotiondair-*
- split: emocontext
path: data/emocontext-*
- split: empathetic
path: data/empathetic-*
- split: agnews
path: data/agnews-*
- split: yahootopics
path: data/yahootopics-*
- split: biasframes_sex
path: data/biasframes_sex-*
- split: biasframes_offensive
path: data/biasframes_offensive-*
- split: biasframes_intent
path: data/biasframes_intent-*
- split: financialphrasebank
path: data/financialphrasebank-*
- split: appreviews
path: data/appreviews-*
- split: hateoffensive
path: data/hateoffensive-*
- split: trueteacher
path: data/trueteacher-*
- split: spam
path: data/spam-*
- split: wikitoxic_toxicaggregated
path: data/wikitoxic_toxicaggregated-*
- split: wikitoxic_obscene
path: data/wikitoxic_obscene-*
- split: wikitoxic_identityhate
path: data/wikitoxic_identityhate-*
- split: wikitoxic_threat
path: data/wikitoxic_threat-*
- split: wikitoxic_insult
path: data/wikitoxic_insult-*
- split: manifesto
path: data/manifesto-*
- split: capsotu
path: data/capsotu-*
---
提供机构:
MoritzLaurer
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- hypothesis: 数据类型为字符串。
- labels: 数据类型为分类标签,包含两个类别:
- 0: 表示 "entailment"
- 1: 表示 "not_entailment"
- task_name: 数据类型为字符串。
- label_text: 数据类型为字符串。
数据集分割
数据集被分割为多个部分,每个部分具有不同的数据量和示例数。以下是部分分割的详细信息:
- mnli_m: 数据量2055427字节,示例数9815。
- mnli_mm: 数据量2181179字节,示例数9832。
- fevernli: 数据量7532028字节,示例数19652。
- anli_r1: 数据量433064字节,示例数1000。
- anli_r2: 数据量432927字节,示例数1000。
- anli_r3: 数据量501290字节,示例数1200。
- wanli: 数据量940472字节,示例数5000。
- lingnli: 数据量1078241字节,示例数4893。
- wellformedquery: 数据量274932字节,示例数2000。
- rottentomatoes: 数据量463520字节,示例数2000。
- amazonpolarity: 数据量1073968字节,示例数2000。
- imdb: 数据量2807450字节,示例数2006。
- yelpreviews: 数据量1581332字节,示例数2000。
- hatexplain: 数据量709210字节,示例数2910。
- massive: 数据量23680622字节,示例数172492。
- banking77: 数据量40009400字节,示例数221760。
- emotiondair: 数据量1902532字节,示例数10344。
- emocontext: 数据量880077字节,示例数5340。
- empathetic: 数据量52141900字节,示例数81344。
- agnews: 数据量2544632字节,示例数8000。
- yahootopics: 数据量34686310字节,示例数50000。
- biasframes_sex: 数据量314648字节,示例数1510。
- biasframes_offensive: 数据量465662字节,示例数2000。
- biasframes_intent: 数据量438394字节,示例数2000。
- financialphrasebank: 数据量515448字节,示例数2070。
- appreviews: 数据量604460字节,示例数2000。
- hateoffensive: 数据量495508字节,示例数2586。
- trueteacher: 数据量2783064字节,示例数2000。
- spam: 数据量181876字节,示例数1262。
- wikitoxic_toxicaggregated: 数据量923604字节,示例数2000。
- wikitoxic_obscene: 数据量894472字节,示例数2000。
- wikitoxic_identityhate: 数据量1010608字节,示例数2000。
- wikitoxic_threat: 数据量725658字节,示例数1422。
- wikitoxic_insult: 数据量833066字节,示例数2000。
- manifesto: 数据量300869505字节,示例数685720。
- capsotu: 数据量23150995字节,示例数66444。
数据集大小
- 下载大小: 26325656字节。
- 数据集总大小: 512117481字节。
配置信息
- config_name: default
- data_files: 列出了所有分割的数据文件路径。



