five

MoritzLaurer/zeroshot_test_downsampled

收藏
Hugging Face2024-03-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/MoritzLaurer/zeroshot_test_downsampled
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text dtype: string - name: hypothesis dtype: string - name: labels dtype: class_label: names: '0': entailment '1': not_entailment - name: task_name dtype: string - name: label_text dtype: string splits: - name: mnli_m num_bytes: 2055427 num_examples: 9815 - name: mnli_mm num_bytes: 2181179 num_examples: 9832 - name: fevernli num_bytes: 7532028 num_examples: 19652 - name: anli_r1 num_bytes: 433064 num_examples: 1000 - name: anli_r2 num_bytes: 432927 num_examples: 1000 - name: anli_r3 num_bytes: 501290 num_examples: 1200 - name: wanli num_bytes: 940472 num_examples: 5000 - name: lingnli num_bytes: 1078241 num_examples: 4893 - name: wellformedquery num_bytes: 274932 num_examples: 2000 - name: rottentomatoes num_bytes: 463520 num_examples: 2000 - name: amazonpolarity num_bytes: 1073968 num_examples: 2000 - name: imdb num_bytes: 2807450 num_examples: 2006 - name: yelpreviews num_bytes: 1581332 num_examples: 2000 - name: hatexplain num_bytes: 709210 num_examples: 2910 - name: massive num_bytes: 23680622 num_examples: 172492 - name: banking77 num_bytes: 40009400 num_examples: 221760 - name: emotiondair num_bytes: 1902532 num_examples: 10344 - name: emocontext num_bytes: 880077 num_examples: 5340 - name: empathetic num_bytes: 52141900 num_examples: 81344 - name: agnews num_bytes: 2544632 num_examples: 8000 - name: yahootopics num_bytes: 34686310 num_examples: 50000 - name: biasframes_sex num_bytes: 314648 num_examples: 1510 - name: biasframes_offensive num_bytes: 465662 num_examples: 2000 - name: biasframes_intent num_bytes: 438394 num_examples: 2000 - name: financialphrasebank num_bytes: 515448 num_examples: 2070 - name: appreviews num_bytes: 604460 num_examples: 2000 - name: hateoffensive num_bytes: 495508 num_examples: 2586 - name: trueteacher num_bytes: 2783064 num_examples: 2000 - name: spam num_bytes: 181876 num_examples: 1262 - name: wikitoxic_toxicaggregated num_bytes: 923604 num_examples: 2000 - name: wikitoxic_obscene num_bytes: 894472 num_examples: 2000 - name: wikitoxic_identityhate num_bytes: 1010608 num_examples: 2000 - name: wikitoxic_threat num_bytes: 725658 num_examples: 1422 - name: wikitoxic_insult num_bytes: 833066 num_examples: 2000 - name: manifesto num_bytes: 300869505 num_examples: 685720 - name: capsotu num_bytes: 23150995 num_examples: 66444 download_size: 26325656 dataset_size: 512117481 configs: - config_name: default data_files: - split: mnli_m path: data/mnli_m-* - split: mnli_mm path: data/mnli_mm-* - split: fevernli path: data/fevernli-* - split: anli_r1 path: data/anli_r1-* - split: anli_r2 path: data/anli_r2-* - split: anli_r3 path: data/anli_r3-* - split: wanli path: data/wanli-* - split: lingnli path: data/lingnli-* - split: wellformedquery path: data/wellformedquery-* - split: rottentomatoes path: data/rottentomatoes-* - split: amazonpolarity path: data/amazonpolarity-* - split: imdb path: data/imdb-* - split: yelpreviews path: data/yelpreviews-* - split: hatexplain path: data/hatexplain-* - split: massive path: data/massive-* - split: banking77 path: data/banking77-* - split: emotiondair path: data/emotiondair-* - split: emocontext path: data/emocontext-* - split: empathetic path: data/empathetic-* - split: agnews path: data/agnews-* - split: yahootopics path: data/yahootopics-* - split: biasframes_sex path: data/biasframes_sex-* - split: biasframes_offensive path: data/biasframes_offensive-* - split: biasframes_intent path: data/biasframes_intent-* - split: financialphrasebank path: data/financialphrasebank-* - split: appreviews path: data/appreviews-* - split: hateoffensive path: data/hateoffensive-* - split: trueteacher path: data/trueteacher-* - split: spam path: data/spam-* - split: wikitoxic_toxicaggregated path: data/wikitoxic_toxicaggregated-* - split: wikitoxic_obscene path: data/wikitoxic_obscene-* - split: wikitoxic_identityhate path: data/wikitoxic_identityhate-* - split: wikitoxic_threat path: data/wikitoxic_threat-* - split: wikitoxic_insult path: data/wikitoxic_insult-* - split: manifesto path: data/manifesto-* - split: capsotu path: data/capsotu-* ---
提供机构:
MoritzLaurer
原始信息汇总

数据集概述

数据集特征

  • text: 数据类型为字符串。
  • hypothesis: 数据类型为字符串。
  • labels: 数据类型为分类标签,包含两个类别:
    • 0: 表示 "entailment"
    • 1: 表示 "not_entailment"
  • task_name: 数据类型为字符串。
  • label_text: 数据类型为字符串。

数据集分割

数据集被分割为多个部分,每个部分具有不同的数据量和示例数。以下是部分分割的详细信息:

  • mnli_m: 数据量2055427字节,示例数9815。
  • mnli_mm: 数据量2181179字节,示例数9832。
  • fevernli: 数据量7532028字节,示例数19652。
  • anli_r1: 数据量433064字节,示例数1000。
  • anli_r2: 数据量432927字节,示例数1000。
  • anli_r3: 数据量501290字节,示例数1200。
  • wanli: 数据量940472字节,示例数5000。
  • lingnli: 数据量1078241字节,示例数4893。
  • wellformedquery: 数据量274932字节,示例数2000。
  • rottentomatoes: 数据量463520字节,示例数2000。
  • amazonpolarity: 数据量1073968字节,示例数2000。
  • imdb: 数据量2807450字节,示例数2006。
  • yelpreviews: 数据量1581332字节,示例数2000。
  • hatexplain: 数据量709210字节,示例数2910。
  • massive: 数据量23680622字节,示例数172492。
  • banking77: 数据量40009400字节,示例数221760。
  • emotiondair: 数据量1902532字节,示例数10344。
  • emocontext: 数据量880077字节,示例数5340。
  • empathetic: 数据量52141900字节,示例数81344。
  • agnews: 数据量2544632字节,示例数8000。
  • yahootopics: 数据量34686310字节,示例数50000。
  • biasframes_sex: 数据量314648字节,示例数1510。
  • biasframes_offensive: 数据量465662字节,示例数2000。
  • biasframes_intent: 数据量438394字节,示例数2000。
  • financialphrasebank: 数据量515448字节,示例数2070。
  • appreviews: 数据量604460字节,示例数2000。
  • hateoffensive: 数据量495508字节,示例数2586。
  • trueteacher: 数据量2783064字节,示例数2000。
  • spam: 数据量181876字节,示例数1262。
  • wikitoxic_toxicaggregated: 数据量923604字节,示例数2000。
  • wikitoxic_obscene: 数据量894472字节,示例数2000。
  • wikitoxic_identityhate: 数据量1010608字节,示例数2000。
  • wikitoxic_threat: 数据量725658字节,示例数1422。
  • wikitoxic_insult: 数据量833066字节,示例数2000。
  • manifesto: 数据量300869505字节,示例数685720。
  • capsotu: 数据量23150995字节,示例数66444。

数据集大小

  • 下载大小: 26325656字节。
  • 数据集总大小: 512117481字节。

配置信息

  • config_name: default
  • data_files: 列出了所有分割的数据文件路径。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作