five

agentlans/arcee-ai-The-Tome

收藏
Hugging Face2025-12-15 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/agentlans/arcee-ai-The-Tome
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个非官方版本的The Tome数据集。根据原始作者的描述,The Tome是一个精选的数据集,专门用于训练大型语言模型,特别关注指令跟随能力,并用于训练Arcee-Nova/Spark模型。该数据集经过了去重和洗牌处理,移除了URL、电子邮件和电话号码等敏感信息,并对每一行进行了语言检测。

This is an unofficial version of The Tome dataset. According to the original authors, the Tome is a curated dataset designed for training large language models with a focus on instruction following and it was used to train the Arcee-Nova/Spark models. The dataset has been deduplicated and shuffled, with URLs, e-mails, phone numbers redacted, and language detection performed for each row.
提供机构:
agentlans
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作