allganize/rag-ko
收藏Hugging Face2024-04-02 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/allganize/rag-ko
下载链接
链接失效反馈官方服务:
资源简介:
`rag-ko`数据集是一个针对金融领域的RAG(检索增强生成)数据集,包含了Golden Context、Negative Context、问题及其答案。数据集的上下文来源于韩语维基百科、韩国银行的金融报告和金融术语集,并使用GPT-4生成问题和答案。数据集经过人工审核,包含200个样本,分为训练集和测试集。
提供机构:
allganize
原始信息汇总
数据集概述
数据集名称
rag-ko
数据集描述
rag-ko数据集是金融领域的RAG(Retrieval Augmented Generation,检索增强生成)数据集。该数据集提供了一个Golden Context和两个Negative Context,以及与Golden Context相关的问答。
数据集特征
- index: int64
- system: string
- human: string
- answer: string
- answer_position: int64
- answer_context_title: string
- answer_context_summary: string
数据集分割
- train: 200个样本,占用914673字节
- test: 200个样本,占用914673字节
数据集大小
- 下载大小: 2352755字节
- 数据集大小: 1829346字节
数据集配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
语言
- 韩语 (ko)
数据来源
- 韩国语维基百科金融分类
- 韩国银行经济研究报告
- 韩国银行海外经济焦点
数据示例
- 包含对话ID和对话记录,其中对话记录包括人类提问和GPT回答。
许可证
- 维基百科: CC BY-SA 4.0
- 韩国银行: 根据其版权保护政策



