davidkim205/ko_hellaswag
收藏Hugging Face2024-03-19 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/davidkim205/ko_hellaswag
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ko
---
# Korean HellaSwag
hellaswag 영어 데이터셋을 한국어로 번역
https://huggingface.co/datasets/Rowan/hellaswag
## Structure
```jsonl
{
"ind": 24,
"activity_label": "지붕 슁글 제거",
"ctx_a": "한 남자가 지붕 위에 앉아 있다.",
"ctx_b": "그",
"ctx": "한 남자가 지붕 위에 앉아 있다. 그",
"endings": [
"스키 한 켤레를 감싸기 위해 랩을 사용하고 있습니다.",
"레벨 타일을 뜯어내고 있습니다.",
"루빅스 큐브를 들고 있습니다.",
"지붕에 지붕을 올리기 시작합니다."
],
"source_id": "activitynet~v_-JhWjGDPHMY",
"split": "val",
"split_type": "indomain",
"label": "3"
}
{...}
```
提供机构:
davidkim205
原始信息汇总
Korean HellaSwag 数据集概述
数据集描述
- 语言: 韩语 (
ko) - 来源: 基于英语数据集 hellaswag 的韩语翻译版本
- 原始链接: Korean HellaSwag
数据结构
数据集以 JSONL 格式存储,每个条目包含以下字段:
- ind: 索引号
- activity_label: 活动标签
- ctx_a: 上下文信息 A
- ctx_b: 上下文信息 B
- ctx: 完整的上下文信息
- endings: 可能的结束语列表
- source_id: 源数据ID
- split: 数据集分割类型(如验证集
val) - split_type: 分割类型描述(如
indomain) - label: 标签(如选项索引
3)
示例条目: json { "ind": 24, "activity_label": "지붕 슁글 제거", "ctx_a": "한 남자가 지붕 위에 앉아 있다.", "ctx_b": "그", "ctx": "한 남자가 지붕 위에 앉아 있다. 그", "endings": [ "스키 한 켤레를 감싸기 위해 랩을 사용하고 있습니다.", "레벨 타일을 뜯어내고 있습니다.", "루빅스 큐브를 들고 있습니다.", "지붕에 지붕을 올리기 시작합니다." ], "source_id": "activitynet~v_-JhWjGDPHMY", "split": "val", "split_type": "indomain", "label": "3" }



