tyzhu/fw_squad_num_train_10000_eval_100

Name: tyzhu/fw_squad_num_train_10000_eval_100
Creator: tyzhu
Published: 2023-08-25 03:33:14
License: 暂无描述

Hugging Face2023-08-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/tyzhu/fw_squad_num_train_10000_eval_100

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: train path: data/train-* - split: train_doc2id path: data/train_doc2id-* - split: train_id2doc path: data/train_id2doc-* - split: train_find_word path: data/train_find_word-* - split: eval_find_word path: data/eval_find_word-* dataset_info: features: - name: inputs dtype: string - name: targets dtype: string - name: text dtype: string splits: - name: train num_bytes: 2875213 num_examples: 20100 - name: train_doc2id num_bytes: 1736063 num_examples: 10100 - name: train_id2doc num_bytes: 1766363 num_examples: 10100 - name: train_find_word num_bytes: 1108850 num_examples: 10000 - name: eval_find_word num_bytes: 10806 num_examples: 100 download_size: 3625030 dataset_size: 7497295 --- # Dataset Card for "fw_squad_num_train_10000_eval_100" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

tyzhu

原始信息汇总

数据集概述

数据集配置

默认配置：
- 训练数据：
  - 路径：data/train-*
- 训练文档到ID映射：
  - 路径：data/train_doc2id-*
- 训练ID到文档映射：
  - 路径：data/train_id2doc-*
- 训练查找单词：
  - 路径：data/train_find_word-*
- 评估查找单词：
  - 路径：data/eval_find_word-*

数据集信息

特征：
- 输入：数据类型为字符串
- 目标：数据类型为字符串
- 文本：数据类型为字符串
数据分割：
- 训练集：
  - 字节数：2875213
  - 样本数：20100
- 训练文档到ID映射：
  - 字节数：1736063
  - 样本数：10100
- 训练ID到文档映射：
  - 字节数：1766363
  - 样本数：10100
- 训练查找单词：
  - 字节数：1108850
  - 样本数：10000
- 评估查找单词：
  - 字节数：10806
  - 样本数：100
数据集大小：
- 下载大小：3625030字节
- 数据集大小：7497295字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集