five

keethu/kubernetes-documentation-dataset

收藏
Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/keethu/kubernetes-documentation-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从Kubernetes官方网站(https://kubernetes.io/docs/concepts/services-networking/)抓取的Kubernetes数据,主要用于文本生成和文本分类任务,特别是针对Kubernetes文档数据的微调。数据集仅包含与Kubernetes的服务、负载均衡和网络相关的数据,而不包括其他文档内容。

This dataset consists of the Kubernetes data that has been scraped from the web(https://kubernetes.io/docs/concepts/services-networking/). It includes a feature named text of string type. The dataset is split into a training set with one example, totaling 159473 bytes. The dataset is licensed under MIT. It is primarily used for fine-tuning large language models for text generation and text classification. The creation of this dataset aims to assist in fine-tuning the GPT model on Kubernetes documentation data. The source of the dataset is the Kubernetes official website.
提供机构:
keethu
原始信息汇总

数据集概述

数据集描述

  • 数据来源: 从Kubernetes网站(https://kubernetes.io/docs/concepts/services-networking/)抓取的数据。
  • 许可: MIT

数据集结构

  • 特征:
    • text: 数据类型为字符串。
  • 分割:
    • train: 包含1个样本,大小为159473字节。
  • 下载大小: 73921字节
  • 数据集大小: 159473字节

配置

  • 默认配置:
    • 数据文件路径: data/train-*

任务类别

  • 文本生成
  • 文本到文本生成

语言

  • 英语

数据集创建

  • 创建动机: 用于在Kubernetes文档数据上微调GPT模型。

偏见、风险和限制

  • 数据仅包含Kubernetes的服务、负载均衡和网络相关内容,不包括其他文档部分。

建议

  • 用户应了解数据集的风险、偏见和限制。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作