vikp/starcoder_filtered
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vikp/starcoder_filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: code
dtype: string
- name: repo_path
dtype: string
splits:
- name: train
num_bytes: 88302798272
num_examples: 13368477
download_size: 1680002223
dataset_size: 88302798272
license: bigcode-openrail-m
---
# Dataset Card for "starcoder_filtered"
A version of the starcoder dataset filtered based on data quality. Data was labeled with a rater model, and low-ranking rows were removed.
提供机构:
vikp
原始信息汇总
数据集概述
数据集名称
- 名称: starcoder_filtered
数据集描述
- 描述: 该数据集是基于starcoder数据集的过滤版本,主要根据数据质量进行筛选。数据通过rater模型进行标注,移除了低排名行。
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集特征
- 特征列表:
- 名称: code
- 数据类型: string
- 名称: repo_path
- 数据类型: string
- 名称: code
数据集分割
- 分割: train
- 字节数: 88302798272
- 示例数: 13368477
数据集大小
- 下载大小: 1680002223
- 数据集大小: 88302798272
许可证
- 许可证: bigcode-openrail-m



