JetBrains/KExercises
收藏Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/JetBrains/KExercises
下载链接
链接失效反馈官方服务:
资源简介:
KExercises数据集由15,000个Kotlin代码练习组成,这些练习是从Code Exercises数据集中生成并由GPT-3.5翻译成Kotlin的。每个训练样本包括一个带有描述性文档字符串的Kotlin函数签名和一个练习的解决方案。数据集遵循HumanEval基准的格式。数据集的语言为Kotlin和英语,包含15,000个样本,335,000行代码和3.5百万个令牌。数据集是合成生成的,用户在使用时应确保符合OpenAI的使用条款,并注意可能存在的不准确或错误。
KExercises数据集由15,000个Kotlin代码练习组成,这些练习是从Code Exercises数据集中生成并由GPT-3.5翻译成Kotlin的。每个训练样本包括一个带有描述性文档字符串的Kotlin函数签名和一个练习的解决方案。数据集遵循HumanEval基准的格式。数据集的语言为Kotlin和英语,包含15,000个样本,335,000行代码和3.5百万个令牌。数据集是合成生成的,用户在使用时应确保符合OpenAI的使用条款,并注意可能存在的不准确或错误。
提供机构:
JetBrains
原始信息汇总
KExercises 数据集
数据集概述
- 名称: KExercises
- 语言: Kotlin, English
- 样本数量: 15K
- 行数: 335K
- 令牌数: 3.5M
数据集结构
- 特征:
problem: 字符串类型solution: 字符串类型
- 分割:
train: 15000 个样本, 11620055 字节
数据集配置
- 配置名称: default
- 数据文件:
train: data/train-*
任务类别
- 文本生成
数据集大小
- 10K<n<100K
许可证
- cc-by-nc-sa-4.0



