SLATE
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SLATE
下载链接
链接失效反馈官方服务:
资源简介:
SLATE论文中使用的火车,验证和测试数据集可以分别在data/train.csv,data/val.csv和data/test.csv中找到。“注释” 列包含从根据以下内容注释的墨水文档中识别的文本:
<s> 句子 <a0>: 非任务型句子 (例如,我爱墨水!)
<s> 句子 <a1>: 任务句子 (例如,将代码审查会议安排在明天。)
<s> 句子 <a2>: 通用任务 (例如,我会做的。)
<s> 句子 <a3>: 由于上下文原因的任务句子。<s> 句子 <a4>: 由于上下文原因的非任务句子。
在SLATE论文中,除 <a0> 注释标签外,所有都被视为任务句子。
wr_lines列给出了识别文本的文档行列表。对于使用换行符的实验,我们在这些文档行之间插入它们。line_list_item掩码列是一个与wr_lines长度相同的列表,其中1表示该行是项目符号,0表示该行不是项目符号。
提供机构:
OpenDataLab
创建时间:
2022-11-24



