five

fuliucansheng/mininlp

收藏
Hugging Face2021-06-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fuliucansheng/mininlp
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于unitorch包的小型NLP数据集。数据集包含id、num、query、doc、label和score等字段,并且所有分割中的数据字段相同。数据集的样本大小包括15000个训练样本、1000个验证样本和1000个测试样本。
提供机构:
fuliucansheng
原始信息汇总

MiniNLP数据集概述

数据集总结

MiniNLP数据集是为unitorch包设计的小型自然语言处理数据集。

数据实例

示例

一个train数据实例的示例如下: json { "id": 1, "num": 3, "query": "Is this a test?", "doc": "train test", "label": "Good", "score": 0.882 }

数据字段

所有分割的数据字段相同,包括:

  • id: 整数型(int32)
  • num: 整数型(int32)
  • query: 字符串型(string)
  • doc: 字符串型(string)
  • label: 字符串型(string)
  • score: 浮点型(float32)

数据分割样本大小

名称 训练集 验证集 测试集
plain_text 15000 1000 1000
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作