five

fairseq2-lm-gsm8k

收藏
魔搭社区2025-12-05 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/facebook/fairseq2-lm-gsm8k
下载链接
链接失效反馈
官方服务:
资源简介:
license: mit task_categories: - text2text-generation language: - en multilinguality: - monolingual tags: - math-word-problems - fairseq2 - lm pretty_name: 'GSM8K ' size_categories: - 10K<n<100K dataset_info: - config_name: sft features: - name: src dtype: string - name: tgt dtype: string - config_name: dpo features: - name: src dtype: string - name: tgt_chosen dtype: string - name: tgt_rejected dtype: string - config_name: test features: - name: src dtype: string - name: tgt dtype: string ---

许可证:MIT许可证 任务类别:文本到文本生成(text2text-generation) 语言:英语(en) 多语言属性:单语言(monolingual) 标签:数学应用题(math-word-problems)、fairseq2、语言模型(lm) 美观名称:GSM8K 样本规模类别:10K < 样本量 < 100K 数据集信息: - 配置名称:sft(监督微调,Supervised Fine-Tuning) 特征: - 名称:源文本(src),数据类型:字符串(string) - 名称:目标文本(tgt),数据类型:字符串(string) - 配置名称:dpo(直接偏好优化,Direct Preference Optimization) 特征: - 名称:源文本(src),数据类型:字符串(string) - 名称:优选目标文本(tgt_chosen),数据类型:字符串(string) - 名称:非优选目标文本(tgt_rejected),数据类型:字符串(string) - 配置名称:test(测试集) 特征: - 名称:源文本(src),数据类型:字符串(string) - 名称:目标文本(tgt),数据类型:字符串(string)
提供机构:
maas
创建时间:
2025-05-20
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作