tyzhu/fw_num_bi_train_10000_eval_100

Name: tyzhu/fw_num_bi_train_10000_eval_100
Creator: tyzhu
Published: 2023-08-21 06:35:39
License: 暂无描述

Hugging Face2023-08-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/tyzhu/fw_num_bi_train_10000_eval_100

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: inputs dtype: string - name: targets dtype: string splits: - name: train num_bytes: 2135417 num_examples: 30200 - name: train_doc2id num_bytes: 817094 num_examples: 10100 - name: train_id2doc num_bytes: 847394 num_examples: 10100 - name: train_find_word num_bytes: 470929 num_examples: 10000 - name: eval_find_word num_bytes: 4823 num_examples: 100 download_size: 929394 dataset_size: 4275657 configs: - config_name: default data_files: - split: train path: data/train-* - split: train_doc2id path: data/train_doc2id-* - split: train_id2doc path: data/train_id2doc-* - split: train_find_word path: data/train_find_word-* - split: eval_find_word path: data/eval_find_word-* --- # Dataset Card for "fw_num_bi_train_10000_eval_100" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

tyzhu

原始信息汇总

数据集概述

数据集信息

特征:
- inputs: 数据类型为字符串
- targets: 数据类型为字符串
数据分割:
- train: 字节数为2135417，样本数为30200
- train_doc2id: 字节数为817094，样本数为10100
- train_id2doc: 字节数为847394，样本数为10100
- train_find_word: 字节数为470929，样本数为10000
- eval_find_word: 字节数为4823，样本数为100
数据大小:
- 下载大小: 929394字节
- 数据集大小: 4275657字节

配置信息

配置名称: default
- 数据文件:
  - train: 路径为data/train-*
  - train_doc2id: 路径为data/train_doc2id-*
  - train_id2doc: 路径为data/train_id2doc-*
  - train_find_word: 路径为data/train_find_word-*
  - eval_find_word: 路径为data/eval_find_word-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集