five

elseodelasgalletas/google-leak-dataset

收藏
Hugging Face2024-05-31 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/elseodelasgalletas/google-leak-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Google Leak Dataset是从2024年5月27日发生的Google泄露事件中提取的数据集,遵循Apache 2.0许可证。数据集包含模块的标题和描述,以及这些模块的键和值,这些数据来源于泄露的Google内容仓库API文档版本0.4.0。数据经过修剪,仅保留标题和描述,并且所有驼峰格式的文本已被替换为更易读的格式。数据集的格式为JSON,包含标题、描述和键值对。

Google Leak Dataset是从2024年5月27日发生的Google泄露事件中提取的数据集,遵循Apache 2.0许可证。数据集包含模块的标题和描述,以及这些模块的键和值,这些数据来源于泄露的Google内容仓库API文档版本0.4.0。数据经过修剪,仅保留标题和描述,并且所有驼峰格式的文本已被替换为更易读的格式。数据集的格式为JSON,包含标题、描述和键值对。
提供机构:
elseodelasgalletas
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本生成
  • 语言: 英语
  • 标签: SEO
  • 美观名称: GLD
  • 大小类别: 1K<n<10K

数据集名称

  • 名称: Google Leak Dataset

数据集描述

  • 数据来源于2024年5月27日的Google泄露事件,根据泄露的Google内容仓库API文档版本0.4.0提取。
  • 存储的数据已改变但未修改,包括模块的标题和描述以及这些模块的键和值。

数据更改说明

  1. 数据已修剪,仅保留标题和描述。
  2. 所有驼峰格式的文本已被替换为便于人类阅读和理解的友好间距、小写并重新大写的文本。

数据集格式

  • 数据格式为JSON,包含字段:title(标题)、description(描述)和values(键值对数组)。

数据源

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作