hanzla/datascience-instruct

Name: hanzla/datascience-instruct
Creator: hanzla
Published: 2024-03-24 21:21:14
License: 暂无描述

Hugging Face2024-03-24 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/hanzla/datascience-instruct

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为datascience instruct dataset，主要用于微调基础大型语言模型（LLMs）以更好地响应数据科学查询。数据集包含用户与助手之间的问答交互，涵盖了数据科学的多个主题。数据集的创建者是Muhammad Hanzla Javaid，语言为英语。数据集来源包括Google Gemini Pro和GPT4。

提供机构：

hanzla

原始信息汇总

数据集概述

数据集名称

datascience instruct dataset

数据集描述

该数据集是一系列围绕数据科学主题的问答集合。其主要目标是优化基础大型语言模型（LLMs），以更好地响应数据科学查询。数据集包含结构化的用户代理交互模式，旨在提升基础模型在数据科学各领域中的回复能力。

数据集特征

user: 数据类型为字符串
assistant: 数据类型为字符串
index_level_0: 数据类型为整数

数据集分割

train: 包含6827个样本，数据大小为8918946字节

数据集大小

下载大小: 4139260字节
数据集大小: 8918946字节

数据集配置

config_name: default
data_files:
- split: train
- path: data/train-*

数据集语言

语言: 英语

数据集创建者

Curated by: Muhammad Hanzla Javaid

5,000+

优质数据集

54 个

任务类型

进入经典数据集