SEACrowd/balita_nlp
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/balita_nlp
下载链接
链接失效反馈官方服务:
资源简介:
BalitaNLP是一个用于图像条件语言生成和文本条件图像生成的数据集。它包含从菲律宾新闻媒体收集的30万条菲律宾新闻文章和图像。新闻文章分为五个类别:新闻、体育、娱乐、犯罪和其他。部分文章因缺少对应图像而被移除:训练集(262480篇文章):从原始的281403篇文章中,18923篇(约6.72%)缺少图像;测试集(32821篇文章):从原始的35177篇文章中,2356篇(约6.70%)缺少图像;验证集(32806篇文章):从原始的35175篇文章中,2369篇(约6.73%)缺少图像。
BalitaNLP是一个用于图像条件语言生成和文本条件图像生成的数据集。它包含从菲律宾新闻媒体收集的30万条菲律宾新闻文章和图像。新闻文章分为五个类别:新闻、体育、娱乐、犯罪和其他。部分文章因缺少对应图像而被移除:训练集(262480篇文章):从原始的281403篇文章中,18923篇(约6.72%)缺少图像;测试集(32821篇文章):从原始的35177篇文章中,2356篇(约6.70%)缺少图像;验证集(32806篇文章):从原始的35175篇文章中,2369篇(约6.73%)缺少图像。
提供机构:
SEACrowd



