tyzhu/fwv2_random_num_train_1000_eval_100
收藏Hugging Face2023-08-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tyzhu/fwv2_random_num_train_1000_eval_100
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: train_doc2id
path: data/train_doc2id-*
- split: train_id2doc
path: data/train_id2doc-*
- split: train_find_word
path: data/train_find_word-*
- split: eval_find_word
path: data/eval_find_word-*
- split: id_context_mapping
path: data/id_context_mapping-*
dataset_info:
features:
- name: inputs
dtype: string
- name: targets
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 195871
num_examples: 2100
- name: train_doc2id
num_bytes: 92393
num_examples: 1100
- name: train_id2doc
num_bytes: 95693
num_examples: 1100
- name: train_find_word
num_bytes: 100178
num_examples: 1000
- name: eval_find_word
num_bytes: 10146
num_examples: 100
- name: id_context_mapping
num_bytes: 60493
num_examples: 1100
download_size: 0
dataset_size: 554774
---
# Dataset Card for "fwv2_random_num_train_1000_eval_100"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
tyzhu
原始信息汇总
数据集概述
数据集名称
fwv2_random_num_train_1000_eval_100
配置信息
- 默认配置 (
default)
数据文件
- 训练集 (
train): 路径data/train-* - 文档到ID映射训练集 (
train_doc2id): 路径data/train_doc2id-* - ID到文档映射训练集 (
train_id2doc): 路径data/train_id2doc-* - 查找单词训练集 (
train_find_word): 路径data/train_find_word-* - 查找单词评估集 (
eval_find_word): 路径data/eval_find_word-* - ID上下文映射 (
id_context_mapping): 路径data/id_context_mapping-*
数据集信息
特征
- 输入 (
inputs): 数据类型string - 目标 (
targets): 数据类型string - 文本 (
text): 数据类型string
分割
- 训练集 (
train): 字节数195871, 样本数2100 - 文档到ID映射训练集 (
train_doc2id): 字节数92393, 样本数1100 - ID到文档映射训练集 (
train_id2doc): 字节数95693, 样本数1100 - 查找单词训练集 (
train_find_word): 字节数100178, 样本数1000 - 查找单词评估集 (
eval_find_word): 字节数10146, 样本数100 - ID上下文映射 (
id_context_mapping): 字节数60493, 样本数1100
数据集大小
- 下载大小:
0 - 数据集大小:
554774



