five

GannaHelal/smile.Ai_traindataset

收藏
Hugging Face2023-06-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GannaHelal/smile.Ai_traindataset
下载链接
链接失效反馈
官方服务:
资源简介:
from transformers import pipeline dataset_name = "GannaHelal/smile.Ai_traindataset" faces = load_dataset(dataset_name) faces = faces["train"] captioner = pipeline("image-to-text",model="Salesforce/blip-image-captioning-large", device=0) def caption_image_data(example): image = example["image"] image_caption = captioner(image)[0]['generated_text'] example['image_caption'] = image_caption return example faces_proc = faces.map(caption_image_data) faces_proc.push_to_hub("GannaHelal/smile.Ai_traindataset")
提供机构:
GannaHelal
原始信息汇总

数据集概述

数据集名称

  • 名称: smile.Ai_traindataset
  • 作者: GannaHelal

数据集内容

  • 类型: 图像数据集
  • 处理: 使用image-to-text模型对图像数据进行文本描述生成

数据集处理流程

  1. 加载数据集: 通过load_dataset函数加载名为smile.Ai_traindataset的数据集。
  2. 数据处理: 使用pipeline定义的image-to-text模型,模型为Salesforce/blip-image-captioning-large,对每张图像生成文本描述。
  3. 更新数据集: 将生成的文本描述添加到数据集中的每条记录,字段名为image_caption
  4. 上传更新后的数据集: 将处理后的数据集重新上传至Hugging Face Hub,仍命名为GannaHelal/smile.Ai_traindataset
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作