five

summykai/chemistry-sft-ultra

收藏
Hugging Face2025-12-18 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/summykai/chemistry-sft-ultra
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Chemistry SFT Ultra,是一个由多个上游化学相关数据集合并而成的语料库,专为文本生成任务设计。数据集包含1,370,322行数据,每行包含messages和metadata两个主要列。messages列是一个聊天风格的消息列表,包含role和content字段;metadata列则提供了关于数据来源、任务、语言、许可证以及化学特定字段的详细信息。数据集以英语为主,适用于指令微调和基于聊天的文本生成。README还提供了使用示例、使用注意事项(包括许可证详情)以及引用信息。

The dataset named Chemistry SFT Ultra is a merged corpus built from multiple upstream sources related to chemistry, designed for text-generation tasks. It contains 1,370,322 rows, each with messages and metadata columns. The messages column is a list of chat-style messages with role and content fields, while the metadata column provides detailed information about the source, task, language, license, and chemistry-specific fields. The dataset is English-focused and intended for instruction-tuning and chat-based text generation. The README also provides usage examples, considerations for use (including licensing details), and citation information.
提供机构:
summykai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作