pheepa/jira-comments-nsp
收藏Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pheepa/jira-comments-nsp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于下一个句子预测(NSP)的句子对及其标签。句子来源于公开的Jira项目数据集。下一个句子始终是同一评论中的下一句或对该评论的回复中的句子。
提供机构:
pheepa
原始信息汇总
数据集概述
基本信息
- 任务类别: 文本生成
- 语言: 英语
- 标签: Jira
- 美观名称: jira-comments
- 大小类别: 1M<n<10M
数据集描述
-
数据集摘要: 包含成对的句子及其下一个句子的标签(next_sentence_label),用于NSP任务。句子来源于公开的Jira项目数据集。下一个句子始终是同一评论中的下一个句子或对该评论的回复中的句子。
-
支持的任务: NSP(下一句预测), MLM(掩码语言模型)
-
语言: 英语
数据集结构
- 数据格式: sentence_a, sentence_b, next_sentence_label



