alonj/FLenQA
收藏Hugging Face2024-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alonj/FLenQA
下载链接
链接失效反馈官方服务:
资源简介:
FLenQA数据集是一个专门设计用于评估输入长度对大型语言模型(LLMs)在问答推理任务中表现影响的数据集。通过引入不同长度、类型和位置的填充,该数据集能够隔离输入长度的影响,并研究模型在不同输入长度下的表现一致性。数据集以JSONL格式存储,每个样本包含多个字段,如`global_sample_id`、`sample_id`、`label`、`facts`、`rule`、`statement`等,用于描述样本的各个方面。
FLenQA数据集是一个专门设计用于评估输入长度对大型语言模型(LLMs)在问答推理任务中表现影响的数据集。通过引入不同长度、类型和位置的填充,该数据集能够隔离输入长度的影响,并研究模型在不同输入长度下的表现一致性。数据集以JSONL格式存储,每个样本包含多个字段,如`global_sample_id`、`sample_id`、`label`、`facts`、`rule`、`statement`等,用于描述样本的各个方面。
提供机构:
alonj
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可: MIT
- 任务类别: 问答
- 标签: QA, multihop, reasoning
数据集特征
- sample_id: 样本ID,数据类型为int64
- label: 标签,数据类型为string
- facts: 事实,序列类型为string
- padding_type: 填充类型,数据类型为string
- dispersion: 分散类型,数据类型为string
- ctx_size: 上下文大小,数据类型为int64
- mixin: 事实与填充的混合,数据类型为string
- dataset: 数据集名称,数据类型为string
- global_sample_id: 全局样本ID,数据类型为int64
- assertion/question: 断言或问题,数据类型为string
- rule: 规则,数据类型为string
- statement: 陈述,序列类型为string
数据集划分
- eval: 评估集,包含12000个样本,大小为85410519字节
数据集大小
- 下载大小: 18218707字节
- 数据集大小: 85410519字节
配置
- config_name: default
- data_files:
- split: eval
- path: data/eval-*
- data_files:



