five

vikp/evol_instruct_code_filtered_39k

收藏
Hugging Face2023-08-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vikp/evol_instruct_code_filtered_39k
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: output dtype: string - name: instruction dtype: string - name: quality_prob dtype: float64 - name: learning_prob dtype: float64 splits: - name: train num_bytes: 56854896.038860105 num_examples: 39078 download_size: 37822990 dataset_size: 56854896.038860105 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "evol_instruct_code_filtered_38k" Filtered version of `nickrosh/Evol-Instruct-Code-80k-v1`, with manual filtering, and automatic filtering based on quality and learning value classifiers.
提供机构:
vikp
原始信息汇总

数据集概述

数据集信息

  • 特征列表

    • output:类型为字符串(string)
    • instruction:类型为字符串(string)
    • quality_prob:类型为浮点数(float64)
    • learning_prob:类型为浮点数(float64)
  • 数据分割

    • train:包含39078个样本,总字节数为56854896.038860105
  • 数据大小

    • 下载大小:37822990字节
    • 数据集大小:56854896.038860105字节

配置信息

  • 配置名称:default
    • 数据文件
      • train:路径为data/train-*

数据集描述

  • 该数据集是nickrosh/Evol-Instruct-Code-80k-v1的过滤版本,经过手动和自动过滤,基于质量和学习价值分类器进行筛选。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作