five

laion/OIG-riverbed-filtered-small

收藏
Hugging Face2023-03-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/laion/OIG-riverbed-filtered-small
下载链接
链接失效反馈
官方服务:
资源简介:
OIG-riverbed-filtered-small是一个经过过滤的小版本数据集,源自laion/OIG数据集。该数据集用于实验过滤、聚类和可视化OIG数据集中的数据。数据集中包含多个子数据集,如unatural_instructions、ul2_plus_oscar_en_00300、infil_dbpedia等,每个子数据集都有相应的样本数量。数据集的README文件还提供了一个主题映射的树状结构,展示了数据集中部分数据的主题分类。建议直接下载数据文件而不是使用Hugging Face的load_datasets方法。

OIG-riverbed-filtered-small是一个经过过滤的小版本数据集,源自laion/OIG数据集。该数据集用于实验过滤、聚类和可视化OIG数据集中的数据。数据集中包含多个子数据集,如unatural_instructions、ul2_plus_oscar_en_00300、infil_dbpedia等,每个子数据集都有相应的样本数量。数据集的README文件还提供了一个主题映射的树状结构,展示了数据集中部分数据的主题分类。建议直接下载数据文件而不是使用Hugging Face的load_datasets方法。
提供机构:
laion
原始信息汇总

数据集概述

数据集名称

  • OIG-riverbed-filtered-small

数据集描述

  • 该数据集是LAION/OIG数据集的一个小型过滤版本,用于实验性研究过滤、聚类和可视化OIG数据集中的数据。

许可证

  • Apache-2.0

下载建议

  • 建议直接下载数据,而不是使用HF load_datasets,下载链接为:OIG_filtered.jsonl
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作