five

ali77sina/SEC-qa-pos-neg-pair

收藏
Hugging Face2024-04-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ali77sina/SEC-qa-pos-neg-pair
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含SEC文件(10-K和Q)的问答对,这些问答对是使用gpt-4-turbo生成的。数据集中的文档分为正面和负面两类,每个问题都有关于正面段落的答案,但负面段落也可能被提供给潜在的检索器以提高性能。每2000字的文档片段中有5个问题,每个问题有5个由GPT-4生成的答案,这些答案的顺序为:1. 正确答案,2. 从正面段落中提取的答案,3. 从正面段落中提取的答案,4. 从负面段落中提取的答案,5. 从负面段落中提取的答案。

该数据集包含SEC文件(10-K和Q)的问答对,这些问答对是使用gpt-4-turbo生成的。数据集中的文档分为正面和负面两类,每个问题都有关于正面段落的答案,但负面段落也可能被提供给潜在的检索器以提高性能。每2000字的文档片段中有5个问题,每个问题有5个由GPT-4生成的答案,这些答案的顺序为:1. 正确答案,2. 从正面段落中提取的答案,3. 从正面段落中提取的答案,4. 从负面段落中提取的答案,5. 从负面段落中提取的答案。
提供机构:
ali77sina
原始信息汇总

数据集概述

基本信息

  • 许可证:Apache-2.0
  • 任务类别:问答
  • 语言:英语
  • 标签:金融
  • 大小类别:1K<n<10K

数据内容

  • 包含SEC文件(10-K和Q)的问答对。
  • 问答对通过gpt-4-turbo生成。
  • 文档分为两类:正面和负面。
  • 每2000字段落中包含5个问题,每个问题对应5个答案,顺序如下:
    1. 正确答案
    2. 从正面段落提取
    3. 从正面段落提取
    4. 从负面段落提取
    5. 从负面段落提取
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作