keethu/kubernetes-documentation-dataset
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/keethu/kubernetes-documentation-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Kubernetes官方网站(https://kubernetes.io/docs/concepts/services-networking/)抓取的Kubernetes数据,主要用于文本生成和文本分类任务,特别是针对Kubernetes文档数据的微调。数据集仅包含与Kubernetes的服务、负载均衡和网络相关的数据,而不包括其他文档内容。
This dataset consists of the Kubernetes data that has been scraped from the web(https://kubernetes.io/docs/concepts/services-networking/). It includes a feature named text of string type. The dataset is split into a training set with one example, totaling 159473 bytes. The dataset is licensed under MIT. It is primarily used for fine-tuning large language models for text generation and text classification. The creation of this dataset aims to assist in fine-tuning the GPT model on Kubernetes documentation data. The source of the dataset is the Kubernetes official website.
提供机构:
keethu
原始信息汇总
数据集概述
数据集描述
- 数据来源: 从Kubernetes网站(https://kubernetes.io/docs/concepts/services-networking/)抓取的数据。
- 许可: MIT
数据集结构
- 特征:
text: 数据类型为字符串。
- 分割:
train: 包含1个样本,大小为159473字节。
- 下载大小: 73921字节
- 数据集大小: 159473字节
配置
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
任务类别
- 文本生成
- 文本到文本生成
语言
- 英语
数据集创建
- 创建动机: 用于在Kubernetes文档数据上微调GPT模型。
偏见、风险和限制
- 数据仅包含Kubernetes的服务、负载均衡和网络相关内容,不包括其他文档部分。
建议
- 用户应了解数据集的风险、偏见和限制。



