ytzi/racket-macro-instr-backtranslation
收藏Hugging Face2024-06-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ytzi/racket-macro-instr-backtranslation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如原始仓库名称、原始路径、宏名称、宏定义、使用情况、指令、消息列表等。数据集分为一个训练集,包含19,525个样本,数据文件大小为1,517,505,359字节。数据集的下载大小为133,074,594字节。
The dataset contains multiple feature fields such as original repository name, original path, macro name, macro definition, usage, instruction, message list, etc. The dataset is divided into a training set containing 19,525 samples, with a data file size of 1,517,505,359 bytes. The download size of the dataset is 133,074,594 bytes.
提供机构:
ytzi
原始信息汇总
数据集概述
数据集特征
- macro_name: 数据类型为字符串。
- macro_def: 数据类型为字符串。
- usage: 数据类型为字符串。
- instruction: 数据类型为字符串。
- messages: 结构为列表,包含以下字段:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- original_blob_id: 数据类型为字符串。
- original_repo_name: 数据类型为字符串。
- original_path: 数据类型为字符串。
- response: 数据类型为字符串。
- backtranslation_content: 结构为结构体,包含以下字段:
- messages: 结构为列表,包含以下字段:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- messages: 结构为列表,包含以下字段:
数据集分割
- train: 包含10429个示例,总大小为110539015字节。
数据集大小
- 下载大小: 20772183字节。
- 数据集大小: 110539015字节。
配置
- default: 训练数据文件路径为
data/train-*。



