yyjb5/tokenized_text_code_search_net_python
收藏Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/yyjb5/tokenized_text_code_search_net_python
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含115,056个训练样本,每个样本由一系列整数(int32)表示,存储在名为input_ids的特征中。数据集的总大小为471,729,600字节,下载大小为214,554,536字节。数据集的配置名为default,训练数据存储在路径为data/train-*的文件中。
This dataset contains 115,056 training samples, each represented by a sequence of integers (int32) stored in a feature named input_ids. The total size of the dataset is 471,729,600 bytes, with a download size of 214,554,536 bytes. The dataset is configured under the name default, and the training data is stored in files with the path data/train-*.
提供机构:
yyjb5
原始信息汇总
数据集概述
特征
- input_ids: 序列类型为
int32。
数据分割
- train:
- 样本数量: 115056
- 字节数: 471729600.0
数据集大小
- 下载大小: 214554536 字节
- 数据集大小: 471729600.0 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



