ali77sina/SEC-qa-pos-neg-pair
收藏Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ali77sina/SEC-qa-pos-neg-pair
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含SEC文件(10-K和Q)的问答对,这些问答对是使用gpt-4-turbo生成的。数据集中的文档分为正面和负面两类,每个问题都有关于正面段落的答案,但负面段落也可能被提供给潜在的检索器以提高性能。每2000字的文档片段中有5个问题,每个问题有5个由GPT-4生成的答案,这些答案的顺序为:1. 正确答案,2. 从正面段落中提取的答案,3. 从正面段落中提取的答案,4. 从负面段落中提取的答案,5. 从负面段落中提取的答案。
该数据集包含SEC文件(10-K和Q)的问答对,这些问答对是使用gpt-4-turbo生成的。数据集中的文档分为正面和负面两类,每个问题都有关于正面段落的答案,但负面段落也可能被提供给潜在的检索器以提高性能。每2000字的文档片段中有5个问题,每个问题有5个由GPT-4生成的答案,这些答案的顺序为:1. 正确答案,2. 从正面段落中提取的答案,3. 从正面段落中提取的答案,4. 从负面段落中提取的答案,5. 从负面段落中提取的答案。
提供机构:
ali77sina
原始信息汇总
数据集概述
基本信息
- 许可证:Apache-2.0
- 任务类别:问答
- 语言:英语
- 标签:金融
- 大小类别:1K<n<10K
数据内容
- 包含SEC文件(10-K和Q)的问答对。
- 问答对通过gpt-4-turbo生成。
- 文档分为两类:正面和负面。
- 每2000字段落中包含5个问题,每个问题对应5个答案,顺序如下:
- 正确答案
- 从正面段落提取
- 从正面段落提取
- 从负面段落提取
- 从负面段落提取



