keethu/kubernetes-documentation-dataset

Name: keethu/kubernetes-documentation-dataset
Creator: keethu
Published: 2024-07-03 15:31:34
License: 暂无描述

Hugging Face2024-07-03 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/keethu/kubernetes-documentation-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从Kubernetes官方网站（https://kubernetes.io/docs/concepts/services-networking/）抓取的Kubernetes数据，主要用于文本生成和文本分类任务，特别是针对Kubernetes文档数据的微调。数据集仅包含与Kubernetes的服务、负载均衡和网络相关的数据，而不包括其他文档内容。

This dataset consists of the Kubernetes data that has been scraped from the web(https://kubernetes.io/docs/concepts/services-networking/). It includes a feature named text of string type. The dataset is split into a training set with one example, totaling 159473 bytes. The dataset is licensed under MIT. It is primarily used for fine-tuning large language models for text generation and text classification. The creation of this dataset aims to assist in fine-tuning the GPT model on Kubernetes documentation data. The source of the dataset is the Kubernetes official website.

提供机构：

keethu

原始信息汇总

数据集概述

数据集描述

数据来源: 从Kubernetes网站（https://kubernetes.io/docs/concepts/services-networking/）抓取的数据。
许可: MIT

数据集结构

特征:
- text: 数据类型为字符串。
分割:
- train: 包含1个样本，大小为159473字节。
下载大小: 73921字节
数据集大小: 159473字节

配置

默认配置:
- 数据文件路径: data/train-*

任务类别

文本生成
文本到文本生成

语言

英语

数据集创建

创建动机: 用于在Kubernetes文档数据上微调GPT模型。

偏见、风险和限制

数据仅包含Kubernetes的服务、负载均衡和网络相关内容，不包括其他文档部分。

建议

用户应了解数据集的风险、偏见和限制。

5,000+

优质数据集

54 个

任务类型

进入经典数据集