five

poludmik/pandas_documentation

收藏
Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/poludmik/pandas_documentation
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: features: - name: text dtype: string - name: code dtype: string splits: - name: pandas_documentation_examples num_bytes: 560942 num_examples: 2130 - name: DS1000 num_bytes: 77538 num_examples: 388 - name: OSSInstruct num_bytes: 2303057 num_examples: 2692 download_size: 1285889 dataset_size: 2941537 configs: - config_name: default data_files: - split: pandas_documentation_examples path: data/pandas_documentation_examples-* - split: DS1000 path: data/DS1000-* - split: OSSInstruct path: data/OSSInstruct-* language: - en pretty_name: p --- 3 datasets: * Web scraped pandas documentation, where each instance is a code example generated by gpt-3.5-turbo based on the examples from documentation. Each instance is one pandas method, type, class, etc. * DS1000 is DS-1000 samples that contain pandas code * OSS-Instruct is [Magicoder's dataset](https://huggingface.co/datasets/ise-uiuc/Magicoder-OSS-Instruct-75K) where pandas occur. Filtering and scraping is available [here](https://github.com/poludmik/AgentToBeNamed).
提供机构:
poludmik
原始信息汇总

数据集概述

数据集信息

  • 许可证: MIT
  • 语言: 英语
  • 预览名称: p

数据集特征

  • text: 字符串类型
  • code: 字符串类型

数据集分割

  • pandas_documentation_examples
    • 示例数量: 2130
    • 字节数: 560942
  • DS1000
    • 示例数量: 388
    • 字节数: 77538
  • OSSInstruct
    • 示例数量: 2692
    • 字节数: 2303057

数据集大小

  • 下载大小: 1285889字节
  • 数据集总大小: 2941537字节

配置

  • 默认配置
    • 数据文件路径
      • pandas_documentation_examples: data/pandas_documentation_examples-*
      • DS1000: data/DS1000-*
      • OSSInstruct: data/OSSInstruct-*

数据集描述

  • pandas_documentation_examples: 基于pandas文档的代码示例,由gpt-3.5-turbo生成。
  • DS1000: 包含pandas代码的DS-1000样本。
  • OSSInstruct: 来自Magicoder的OSS-Instruct数据集,其中包含pandas代码。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作