BEE-spoke-data/jinaai_negation-dataset-v2-hf
收藏Hugging Face2024-01-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BEE-spoke-data/jinaai_negation-dataset-v2-hf
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是`jinaai/negation-dataset-v2`的HuggingFace格式版本,主要包含文本、正面文本、负面文本和来源四个特征,用于句子相似性任务。数据集包含训练集和测试集,训练集有50,000个样本,测试集有1,000个样本。
该数据集是`jinaai/negation-dataset-v2`的HuggingFace格式版本,主要包含文本、正面文本、负面文本和来源四个特征,用于句子相似性任务。数据集包含训练集和测试集,训练集有50,000个样本,测试集有1,000个样本。
提供机构:
BEE-spoke-data
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可: odc-by
- 数据规模: 10K<n<100K
- 源数据集: jinaai/negation-dataset-v2
- 任务类别: 句子相似度
数据集信息
-
特征:
- text: 字符串类型
- positive: 字符串类型
- negative: 字符串类型
- source: 字符串类型
-
分割:
- train:
- 字节数: 11603548
- 样本数: 50000
- test:
- 字节数: 244324
- 样本数: 1000
- train:
-
下载大小: 8378043
-
数据集大小: 11847872
配置
- 配置名称: default
- 数据文件:
- train: data/train-*
- test: data/test-*



