five

malhajar/hellaswag-tr

收藏
Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/hellaswag-tr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Hellaswag的土耳其语翻译版本,专门用于OpenLLMTurkishLeaderboard。它包含从ACL2019发表的论文《Can a Machine Really Finish Your Sentence?》中提取的严格测试,主要用于测试模型的完成能力。该数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的性能。

该数据集是Hellaswag的土耳其语翻译版本,专门用于OpenLLMTurkishLeaderboard。它包含从ACL2019发表的论文《Can a Machine Really Finish Your Sentence?》中提取的严格测试,主要用于测试模型的完成能力。该数据集旨在通过建立严格的土耳其语基准来评估土耳其语言模型的性能。
提供机构:
malhajar
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 问答
  • 语言: 土耳其语
  • 数据集大小: 10K<n<100K

数据集划分

  • 训练集:
    • 字节数: 43232624
    • 样本数: 39905
  • 测试集:
    • 字节数: 10791853
    • 样本数: 10003
  • 验证集:
    • 字节数: 11175717
    • 样本数: 10042

数据集特征

  • ind: 类型 int32
  • activity_label: 类型 string
  • ctx_a: 类型 string
  • ctx_b: 类型 string
  • ctx: 类型 string
  • endings: 序列类型 string
  • source_id: 类型 string
  • split: 类型 string
  • split_type: 类型 string
  • label: 类型 string

数据集描述

  • 语言: 土耳其语
  • 翻译来源: hellaswag
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作