agicommies/synthia
收藏Hugging Face2025-01-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/agicommies/synthia
下载链接
链接失效反馈官方服务:
资源简介:
Synthia数据集是一个不断增长的合成解释数据集,这些解释基于Claude Opus潜在空间中的主题,涵盖了广泛的技术领域。解释的目标受众、详细程度和抽象程度各不相同,并且旨在达到Claude3级别的质量。Synthia子网利用Commune的激励机制,创建了一个无许可的挖掘市场,旨在从SOTA闭源模型API中提炼知识,形成公共数据集,以加速开源AI领域的发展。验证模型和策略将根据当前的SOTA进行适应。
Synthia数据集是一个不断增长的合成解释数据集,这些解释基于Claude Opus潜在空间中的主题,涵盖了广泛的技术领域。解释的目标受众、详细程度和抽象程度各不相同,并且旨在达到Claude3级别的质量。Synthia子网利用Commune的激励机制,创建了一个无许可的挖掘市场,旨在从SOTA闭源模型API中提炼知识,形成公共数据集,以加速开源AI领域的发展。验证模型和策略将根据当前的SOTA进行适应。
提供机构:
agicommies
原始信息汇总
数据集概述
数据集名称
- Synthia Dataset
数据集描述
- 该数据集是一个不断增长的集合,包含从Claude Opus潜在空间中选取的各种技术领域主题的合成解释。这些解释针对不同的目标受众,具有不同的详细程度和抽象层次,旨在达到Claude3级别的质量。
数据集用途
- 用于Table Question Answering(表格问题回答)
- 用于Summarization(总结)
- 用于Question Answering(问题回答)
数据集规模
- 规模范围:100B<n<1T
许可证
- MIT许可证



