five

ilovehentai9000/the-un-laion-temple

收藏
Hugging Face2024-07-09 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/ilovehentai9000/the-un-laion-temple
下载链接
链接失效反馈
官方服务:
资源简介:
The Unlaion Temple是一个包含CommonCrawl图像的原始数据集,估计包含20亿个URL。数据集未验证这些链接是否有效。数据集已根据用户反馈进行了改进,包括捕获所有图像的alt文本和添加了图像和标题。使用此数据集时需自行负责处理数据。

The Unlaion Temple is a raw dataset of CommonCrawl images, estimated to contain 2 billion URLs. The dataset has not verified whether these links are functional. Improvements have been made to the dataset based on user feedback, including capturing alt text for all images and adding images and captions. Users are responsible for handling the data when using this dataset.
提供机构:
ilovehentai9000
原始信息汇总

数据集卡片:The Unlaion Temple

数据集详情

数据集描述

  • 来源:CommonCrawl图像
  • 规模:约20亿个URL
  • 内容:包含图像及其alt文本,以及图表图像和标题
  • 验证:未验证链接的有效性

改进

  • 所有图像已捕获,包括alt文本
  • 添加了图表图像和标题

使用建议

  • 强烈建议不要使用此数据集

版权问题

  • 如遇版权问题,请勿责备数据集创建者,应联系文件托管网站请求移除

特别通知

  • 适用对象:仅适用于特定公司和组织及其子公司
  • 使用声明
    • 不得代表或隶属于上述公司和组织
    • 使用数据集应独立于任何与这些实体的关联
    • 保证数据集不会通过您的行动落入上述公司和组织手中
    • 承诺在62天内公开披露所有生成的数据集和脚本
  • 例外:Open Model Initiative成员不受上述限制
二维码
社区交流群
二维码
科研交流群
商业服务