GannaHelal/smile.Ai_traindataset

Name: GannaHelal/smile.Ai_traindataset
Creator: GannaHelal
Published: 2023-06-23 15:10:19
License: 暂无描述

Hugging Face2023-06-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/GannaHelal/smile.Ai_traindataset

下载链接

链接失效反馈

官方服务：

资源简介：

from transformers import pipeline dataset_name = "GannaHelal/smile.Ai_traindataset" faces = load_dataset(dataset_name) faces = faces["train"] captioner = pipeline("image-to-text",model="Salesforce/blip-image-captioning-large", device=0) def caption_image_data(example): image = example["image"] image_caption = captioner(image)[0]['generated_text'] example['image_caption'] = image_caption return example faces_proc = faces.map(caption_image_data) faces_proc.push_to_hub("GannaHelal/smile.Ai_traindataset")

提供机构：

GannaHelal

原始信息汇总

数据集概述

数据集名称

名称: smile.Ai_traindataset
作者: GannaHelal

数据集内容

类型: 图像数据集
处理: 使用image-to-text模型对图像数据进行文本描述生成

数据集处理流程

加载数据集: 通过load_dataset函数加载名为smile.Ai_traindataset的数据集。
数据处理: 使用pipeline定义的image-to-text模型，模型为Salesforce/blip-image-captioning-large，对每张图像生成文本描述。
更新数据集: 将生成的文本描述添加到数据集中的每条记录，字段名为image_caption。
上传更新后的数据集: 将处理后的数据集重新上传至Hugging Face Hub，仍命名为GannaHelal/smile.Ai_traindataset。

5,000+

优质数据集

54 个

任务类型

进入经典数据集