haebo1/test
收藏Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/haebo1/test
下载链接
链接失效反馈官方服务:
资源简介:
KoBEST是一个韩语基准套件,包含5个需要高级韩语知识的自然语言理解任务。这些任务包括布尔问答、合理替代选择、上下文中的词语、HellaSwag和情感否定识别。数据集的结构包括不同任务的数据实例、数据字段和数据分割。数据集的创建、使用考虑和附加信息也在README文件中有所描述。
KoBEST是一个韩语基准套件,包含5个需要高级韩语知识的自然语言理解任务。这些任务包括布尔问答、合理替代选择、上下文中的词语、HellaSwag和情感否定识别。数据集的结构包括不同任务的数据实例、数据字段和数据分割。数据集的创建、使用考虑和附加信息也在README文件中有所描述。
提供机构:
haebo1
原始信息汇总
数据集概述
数据集名称
- 名称:KoBEST
数据集属性
- 语言:韩语 (
ko-KR) - 许可证:CC-BY-SA-4.0
- 多语言性:单语种
- 大小:10,000 < n < 100,000
- 数据来源:原始数据
数据集配置
- 配置名称:boolq, copa, hellaswag, sentineg, wic
- 数据文件路径:对应配置名称的子目录
数据集结构
-
数据实例:
- KB-BoolQ:包含段落、问题和标签(真/假)
- KB-COPA:包含前提、问题、两个备选答案和标签
- KB-WiC:包含目标词、两个上下文和标签(真/假)
- KB-HellaSwag:包含上下文和四个可能的结尾,以及标签
- KB-SentiNeg:包含句子及其情感标签(正面/负面)
-
数据字段:
- KB-BoolQ:段落、问题、标签
- KB-COPA:前提、问题、备选答案1、备选答案2、标签
- KB-WiC:目标词、上下文1、上下文2、标签
- KB-HellaSwag:上下文、结尾1、结尾2、结尾3、结尾4、标签
- KB-SentiNeg:句子、标签
-
数据分割:
- KB-BoolQ:训练集3,665,开发集700,测试集1,404
- KB-COPA:训练集3,076,开发集1,000,测试集1,000
- KB-WiC:训练集3,318,开发集1,260,测试集1,260
- KB-HellaSwag:训练集3,665,开发集700,测试集1,404
- KB-SentiNeg:训练集3,649,开发集400,测试集397,测试集原始数据397
数据集创建
- 注释创建者:专家生成
- 语言创建者:专家生成
许可证信息
- 许可证:CC-BY-SA-4.0
贡献者
- 贡献者:@MJ-Jang



