poludmik/pandas_documentation
收藏Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/poludmik/pandas_documentation
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
dataset_info:
features:
- name: text
dtype: string
- name: code
dtype: string
splits:
- name: pandas_documentation_examples
num_bytes: 560942
num_examples: 2130
- name: DS1000
num_bytes: 77538
num_examples: 388
- name: OSSInstruct
num_bytes: 2303057
num_examples: 2692
download_size: 1285889
dataset_size: 2941537
configs:
- config_name: default
data_files:
- split: pandas_documentation_examples
path: data/pandas_documentation_examples-*
- split: DS1000
path: data/DS1000-*
- split: OSSInstruct
path: data/OSSInstruct-*
language:
- en
pretty_name: p
---
3 datasets:
* Web scraped pandas documentation, where each instance is a code example generated by gpt-3.5-turbo based on the examples from documentation. Each instance is one pandas method, type, class, etc.
* DS1000 is DS-1000 samples that contain pandas code
* OSS-Instruct is [Magicoder's dataset](https://huggingface.co/datasets/ise-uiuc/Magicoder-OSS-Instruct-75K) where pandas occur.
Filtering and scraping is available [here](https://github.com/poludmik/AgentToBeNamed).
提供机构:
poludmik
原始信息汇总
数据集概述
数据集信息
- 许可证: MIT
- 语言: 英语
- 预览名称: p
数据集特征
- text: 字符串类型
- code: 字符串类型
数据集分割
- pandas_documentation_examples
- 示例数量: 2130
- 字节数: 560942
- DS1000
- 示例数量: 388
- 字节数: 77538
- OSSInstruct
- 示例数量: 2692
- 字节数: 2303057
数据集大小
- 下载大小: 1285889字节
- 数据集总大小: 2941537字节
配置
- 默认配置
- 数据文件路径
- pandas_documentation_examples: data/pandas_documentation_examples-*
- DS1000: data/DS1000-*
- OSSInstruct: data/OSSInstruct-*
- 数据文件路径
数据集描述
- pandas_documentation_examples: 基于pandas文档的代码示例,由gpt-3.5-turbo生成。
- DS1000: 包含pandas代码的DS-1000样本。
- OSSInstruct: 来自Magicoder的OSS-Instruct数据集,其中包含pandas代码。



