five

allganize/rag-ko

收藏
Hugging Face2024-04-02 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/allganize/rag-ko
下载链接
链接失效反馈
官方服务:
资源简介:
`rag-ko`数据集是一个针对金融领域的RAG(检索增强生成)数据集,包含了Golden Context、Negative Context、问题及其答案。数据集的上下文来源于韩语维基百科、韩国银行的金融报告和金融术语集,并使用GPT-4生成问题和答案。数据集经过人工审核,包含200个样本,分为训练集和测试集。
提供机构:
allganize
原始信息汇总

数据集概述

数据集名称

  • rag-ko

数据集描述

  • rag-ko 数据集是金融领域的RAG(Retrieval Augmented Generation,检索增强生成)数据集。该数据集提供了一个Golden Context和两个Negative Context,以及与Golden Context相关的问答。

数据集特征

  • index: int64
  • system: string
  • human: string
  • answer: string
  • answer_position: int64
  • answer_context_title: string
  • answer_context_summary: string

数据集分割

  • train: 200个样本,占用914673字节
  • test: 200个样本,占用914673字节

数据集大小

  • 下载大小: 2352755字节
  • 数据集大小: 1829346字节

数据集配置

  • config_name: default
  • data_files:
    • train: data/train-*
    • test: data/test-*

语言

  • 韩语 (ko)

数据来源

  • 韩国语维基百科金融分类
  • 韩国银行经济研究报告
  • 韩国银行海外经济焦点

数据示例

  • 包含对话ID和对话记录,其中对话记录包括人类提问和GPT回答。

许可证

  • 维基百科: CC BY-SA 4.0
  • 韩国银行: 根据其版权保护政策
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作