TIGER-Lab/LongICLBench
收藏Hugging Face2025-02-20 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/TIGER-Lab/LongICLBench
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是在论文《Long-context LLMs Struggle with Long In-context Learning》中采用的基准。数据集包含多轮提示和标签,特征包括1 Round Prompt、2 Round Prompt、3 Round Prompt、4 Round Prompt、5 Round Prompt和label。数据集的分割包括GoEmotion、BANKING77、FewNERD、TacRED、Discovery和DialogRE,每个分割的字节大小和示例数量也有所不同。
提供机构:
TIGER-Lab
原始信息汇总
数据集概述
特征信息
- 1 Round Prompt: 数据类型为字符串。
- 2 Round Prompt: 数据类型为字符串。
- 3 Round Prompt: 数据类型为字符串。
- 4 Round Prompt: 数据类型为字符串。
- 5 Round Prompt: 数据类型为字符串。
- label: 数据类型为字符串。
数据分割
- GoEmotion: 数据大小为22269392字节,包含500个样本。
- BANKING77: 数据大小为63903578字节,包含500个样本。
- FewNERD: 数据大小为117612568字节,包含500个样本。
- TacRED: 数据大小为35790846字节,包含500个样本。
- Discovery: 数据大小为353082806字节,包含500个样本。
- DialogRE: 数据大小为35512103字节,包含118个样本。
数据集大小
- 下载大小: 281420232字节。
- 数据集大小: 628171293字节。
配置信息
- 默认配置:
- GoEmotion: 数据文件路径为
data/GoEmotion-*。 - BANKING77: 数据文件路径为
data/BANKING77-*。 - FewNERD: 数据文件路径为
data/FewNERD-*。 - TacRED: 数据文件路径为
data/TacRED-*。 - Discovery: 数据文件路径为
data/Discovery-*。 - DialogRE: 数据文件路径为
data/DialogRE-*。
- GoEmotion: 数据文件路径为



