fuliucansheng/mininlp
收藏Hugging Face2021-06-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fuliucansheng/mininlp
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于unitorch包的小型NLP数据集。数据集包含id、num、query、doc、label和score等字段,并且所有分割中的数据字段相同。数据集的样本大小包括15000个训练样本、1000个验证样本和1000个测试样本。
提供机构:
fuliucansheng
原始信息汇总
MiniNLP数据集概述
数据集总结
MiniNLP数据集是为unitorch包设计的小型自然语言处理数据集。
数据实例
示例
一个train数据实例的示例如下: json { "id": 1, "num": 3, "query": "Is this a test?", "doc": "train test", "label": "Good", "score": 0.882 }
数据字段
所有分割的数据字段相同,包括:
id: 整数型(int32)num: 整数型(int32)query: 字符串型(string)doc: 字符串型(string)label: 字符串型(string)score: 浮点型(float32)
数据分割样本大小
| 名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| plain_text | 15000 | 1000 | 1000 |



