GannaHelal/smile.Ai_traindataset
收藏Hugging Face2023-06-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GannaHelal/smile.Ai_traindataset
下载链接
链接失效反馈官方服务:
资源简介:
from transformers import pipeline
dataset_name = "GannaHelal/smile.Ai_traindataset"
faces = load_dataset(dataset_name)
faces = faces["train"]
captioner = pipeline("image-to-text",model="Salesforce/blip-image-captioning-large", device=0)
def caption_image_data(example):
image = example["image"]
image_caption = captioner(image)[0]['generated_text']
example['image_caption'] = image_caption
return example
faces_proc = faces.map(caption_image_data)
faces_proc.push_to_hub("GannaHelal/smile.Ai_traindataset")
提供机构:
GannaHelal
原始信息汇总
数据集概述
数据集名称
- 名称: smile.Ai_traindataset
- 作者: GannaHelal
数据集内容
- 类型: 图像数据集
- 处理: 使用
image-to-text模型对图像数据进行文本描述生成
数据集处理流程
- 加载数据集: 通过
load_dataset函数加载名为smile.Ai_traindataset的数据集。 - 数据处理: 使用
pipeline定义的image-to-text模型,模型为Salesforce/blip-image-captioning-large,对每张图像生成文本描述。 - 更新数据集: 将生成的文本描述添加到数据集中的每条记录,字段名为
image_caption。 - 上传更新后的数据集: 将处理后的数据集重新上传至Hugging Face Hub,仍命名为
GannaHelal/smile.Ai_traindataset。



