Waterfront/social-media-captions-20k
收藏Hugging Face2023-10-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Waterfront/social-media-captions-20k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于Seungbae Kim等人的Instagram Influencer Dataset,并扩展了ydshieh/vit-gpt2-coco-en模型的照片描述,以创建一个可用于微调Llama-2的数据集。数据集包含60k完整数据和10k较小子集。
提供机构:
Waterfront
原始信息汇总
社交媒体标题数据集
数据集概述
- 数据集名称: 社交媒体标题数据集
- 数据来源: 基于Instagram Influencer Dataset from Seungbae Kim, Jyun-Yu Jiang, and Wei Wang
- 扩展内容: 通过ydshieh/vit-gpt2-coco-en模型的照片描述进行扩展
- 用途: 用于微调Llama-2模型
数据集版本
- 完整数据集: 60k条数据,位于Waterfront/social-media-captions
- 小规模子集: 10k条数据,位于Waterfront/social-media-captions-10k
数据集属性
- 许可证: MIT
- 任务类别: 对话式
- 标签: 社交媒体
- 数据规模: 10K<n<100K



