five

junlinw/opc-sft-s2-annealing-python_AST_1.0_200.0_var3

收藏
Hugging Face2025-09-15 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/junlinw/opc-sft-s2-annealing-python_AST_1.0_200.0_var3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个特征:input_ids,labels,num_mask_tokens和original。input_ids和original是整数列表,labels和num_mask_tokens是整数。数据集分为训练集和测试集,其中训练集包含2871202个示例,大小为8346683304字节;测试集包含29003个示例,大小为84695316字节。数据集的总大小为8431378620字节,下载大小为1473015508字节。默认配置下,训练集数据文件路径为data/train-*,测试集数据文件路径为data/test-*。

The dataset includes four features: input_ids, labels, num_mask_tokens, and original. input_ids and original are integer lists, while labels and num_mask_tokens are integers. The dataset is split into a training set and a test set, with the training set containing 2871202 examples and a size of 8346683304 bytes; the test set contains 29003 examples and is 84695316 bytes in size. The total size of the dataset is 8431378620 bytes, and the download size is 1473015508 bytes. Under the default configuration, the training set data file path is data/train-* and the test set data file path is data/test-*.
提供机构:
junlinw
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作