five

haebo1/test

收藏
Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/haebo1/test
下载链接
链接失效反馈
官方服务:
资源简介:
KoBEST是一个韩语基准套件,包含5个需要高级韩语知识的自然语言理解任务。这些任务包括布尔问答、合理替代选择、上下文中的词语、HellaSwag和情感否定识别。数据集的结构包括不同任务的数据实例、数据字段和数据分割。数据集的创建、使用考虑和附加信息也在README文件中有所描述。

KoBEST是一个韩语基准套件,包含5个需要高级韩语知识的自然语言理解任务。这些任务包括布尔问答、合理替代选择、上下文中的词语、HellaSwag和情感否定识别。数据集的结构包括不同任务的数据实例、数据字段和数据分割。数据集的创建、使用考虑和附加信息也在README文件中有所描述。
提供机构:
haebo1
原始信息汇总

数据集概述

数据集名称

  • 名称:KoBEST

数据集属性

  • 语言:韩语 (ko-KR)
  • 许可证:CC-BY-SA-4.0
  • 多语言性:单语种
  • 大小:10,000 < n < 100,000
  • 数据来源:原始数据

数据集配置

  • 配置名称:boolq, copa, hellaswag, sentineg, wic
  • 数据文件路径:对应配置名称的子目录

数据集结构

  • 数据实例

    • KB-BoolQ:包含段落、问题和标签(真/假)
    • KB-COPA:包含前提、问题、两个备选答案和标签
    • KB-WiC:包含目标词、两个上下文和标签(真/假)
    • KB-HellaSwag:包含上下文和四个可能的结尾,以及标签
    • KB-SentiNeg:包含句子及其情感标签(正面/负面)
  • 数据字段

    • KB-BoolQ:段落、问题、标签
    • KB-COPA:前提、问题、备选答案1、备选答案2、标签
    • KB-WiC:目标词、上下文1、上下文2、标签
    • KB-HellaSwag:上下文、结尾1、结尾2、结尾3、结尾4、标签
    • KB-SentiNeg:句子、标签
  • 数据分割

    • KB-BoolQ:训练集3,665,开发集700,测试集1,404
    • KB-COPA:训练集3,076,开发集1,000,测试集1,000
    • KB-WiC:训练集3,318,开发集1,260,测试集1,260
    • KB-HellaSwag:训练集3,665,开发集700,测试集1,404
    • KB-SentiNeg:训练集3,649,开发集400,测试集397,测试集原始数据397

数据集创建

  • 注释创建者:专家生成
  • 语言创建者:专家生成

许可证信息

  • 许可证:CC-BY-SA-4.0

贡献者

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作