five

notrichardren/azaria-mitchell-diff-filtered-2

收藏
Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/notrichardren/azaria-mitchell-diff-filtered-2
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: cities path: data/cities-* - split: companies path: data/companies-* - split: animals path: data/animals-* - split: elements path: data/elements-* - split: inventions path: data/inventions-* - split: facts path: data/facts-* dataset_info: features: - name: claim dtype: string - name: label dtype: int64 - name: dataset dtype: string - name: qa_type dtype: int64 - name: ind dtype: int64 splits: - name: cities num_bytes: 311504 num_examples: 4416 - name: companies num_bytes: 86125 num_examples: 777 - name: animals num_bytes: 60222 num_examples: 692 - name: elements num_bytes: 52499 num_examples: 636 - name: inventions num_bytes: 49480 num_examples: 594 - name: facts num_bytes: 43529 num_examples: 472 download_size: 209164 dataset_size: 603359 --- # Dataset Card for "azaria-mitchell-diff-filtered-2" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置: - 配置名称:默认 数据文件: - 拆分:城市 路径:data/cities-* - 拆分:公司 路径:data/companies-* - 拆分:动物 路径:data/animals-* - 拆分:元素 路径:data/elements-* - 拆分:发明 路径:data/inventions-* - 拆分:事实 路径:data/facts-* 数据集信息: 特征: - 名称:主张 数据类型:字符串 - 名称:标签 数据类型:int64 - 名称:问答类型 数据类型:int64 - 名称:索引 数据类型:int64 拆分: - 名称:城市 字节数:311504 样本数:4416 - 名称:公司 字节数:86125 样本数:777 - 名称:动物 字节数:60222 样本数:692 - 名称:元素 字节数:52499 样本数:636 - 名称:发明 字节数:49480 样本数:594 - 名称:事实 字节数:43529 样本数:472 下载大小:209164 数据集大小:603359 # 数据集卡片:"azaria-mitchell-diff-filtered-2" [更多信息请参见](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
notrichardren
原始信息汇总

数据集概述

数据集配置

  • 默认配置:包含多个数据文件,分为以下几个部分:
    • cities:路径为 data/cities-*
    • companies:路径为 data/companies-*
    • animals:路径为 data/animals-*
    • elements:路径为 data/elements-*
    • inventions:路径为 data/inventions-*
    • facts:路径为 data/facts-*

数据集信息

  • 特征

    • claim:类型为 string
    • label:类型为 int64
    • dataset:类型为 string
    • qa_type:类型为 int64
    • ind:类型为 int64
  • 数据分割

    • cities:字节数为 311504,样本数为 4416
    • companies:字节数为 86125,样本数为 777
    • animals:字节数为 60222,样本数为 692
    • elements:字节数为 52499,样本数为 636
    • inventions:字节数为 49480,样本数为 594
    • facts:字节数为 43529,样本数为 472
  • 数据集大小

    • 下载大小:209164 字节
    • 数据集大小:603359 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作