five

mimartin1234/uplimit-synthetic-data-week-1-with-seed

收藏
Hugging Face2025-04-04 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/mimartin1234/uplimit-synthetic-data-week-1-with-seed
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由distilabel生成的合成数据集,包含了与19世纪辛辛那提美国艺术和当地文化遗产相关的查询和指令。数据集的特征包括ID、个人资料、模型名称嵌入、嵌入向量、最近邻索引和得分、投影、聚类标签、摘要标签和指令等。数据集的结构旨在为AI模型提供有关艺术史和博物馆专业的查询,以促进模型的文本生成功能。

This is a synthetic dataset generated with distilabel, containing queries and instructions related to 19th-century American art in Cincinnati and its local cultural heritage. The dataset features include ID, persona, model name embeddings, embedding vectors, nearest neighbor indices and scores, projections, cluster labels, summary labels, and instructions. The structure of the dataset is designed to provide AI models with queries about art history and museum professionalism to enhance the models text generation capabilities.
提供机构:
mimartin1234
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作