five

amd/Instella-GSM8K-synthetic

收藏
Hugging Face2025-11-14 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/amd/Instella-GSM8K-synthetic
下载链接
链接失效反馈
官方服务:
资源简介:
Instella-GSM8K-synthetic数据集是一个合成数据集,用于Instella-3B模型的第二阶段预训练。该数据集通过将GSM8k数据集中的数值替换为可由相同Python程序解答的替代值来生成新的问题和答案对,并用于模型训练。

The Instella-GSM8K-synthetic dataset is a synthetic dataset used for the second stage pre-training of the Instella-3B model. It is generated by replacing the numerical values in the GSM8k dataset with alternative values that can be answered by the same Python program, creating new question-answer pairs for model training.
提供机构:
amd
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作