gguichard/wsd_myriade_synth_data_multilabel_flan-t5
收藏Hugging Face2024-03-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/gguichard/wsd_myriade_synth_data_multilabel_flan-t5
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为wsd_myriade_synth_data_multilabel_flan-t5,包含训练和测试数据,数据特征包括tokens, wn_sens, input_ids, attention_mask, 和 labels。数据集分为训练集(96254样本)和测试集(5067样本),总大小为64785656.0字节。
该数据集名为wsd_myriade_synth_data_multilabel_flan-t5,包含训练和测试数据,数据特征包括tokens, wn_sens, input_ids, attention_mask, 和 labels。数据集分为训练集(96254样本)和测试集(5067样本),总大小为64785656.0字节。
提供机构:
gguichard
原始信息汇总
数据集概述
配置信息
- 默认配置 (
config_name: default):- 训练数据文件 (
split: train):data/train-* - 测试数据文件 (
split: test):data/test-*
- 训练数据文件 (
数据集特征
- tokens: 字符串序列
- wn_sens: 整数序列 (int64)
- input_ids: 整数序列 (int32)
- attention_mask: 整数序列 (int8)
- labels: 浮点数序列 (float64)
数据集分割
- 训练集 (
name: train):- 数据量: 61545765.76054323 字节
- 样本数: 96254
- 测试集 (
name: test):- 数据量: 3239890.239456776 字节
- 样本数: 5067
数据集大小
- 下载大小: 16835884 字节
- 数据集总大小: 64785656.0 字节



