fairseq2-lm-gsm8k
收藏魔搭社区2025-12-05 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/facebook/fairseq2-lm-gsm8k
下载链接
链接失效反馈官方服务:
资源简介:
license: mit
task_categories:
- text2text-generation
language:
- en
multilinguality:
- monolingual
tags:
- math-word-problems
- fairseq2
- lm
pretty_name: 'GSM8K '
size_categories:
- 10K<n<100K
dataset_info:
- config_name: sft
features:
- name: src
dtype: string
- name: tgt
dtype: string
- config_name: dpo
features:
- name: src
dtype: string
- name: tgt_chosen
dtype: string
- name: tgt_rejected
dtype: string
- config_name: test
features:
- name: src
dtype: string
- name: tgt
dtype: string
---
许可证:MIT许可证
任务类别:文本到文本生成(text2text-generation)
语言:英语(en)
多语言属性:单语言(monolingual)
标签:数学应用题(math-word-problems)、fairseq2、语言模型(lm)
美观名称:GSM8K
样本规模类别:10K < 样本量 < 100K
数据集信息:
- 配置名称:sft(监督微调,Supervised Fine-Tuning)
特征:
- 名称:源文本(src),数据类型:字符串(string)
- 名称:目标文本(tgt),数据类型:字符串(string)
- 配置名称:dpo(直接偏好优化,Direct Preference Optimization)
特征:
- 名称:源文本(src),数据类型:字符串(string)
- 名称:优选目标文本(tgt_chosen),数据类型:字符串(string)
- 名称:非优选目标文本(tgt_rejected),数据类型:字符串(string)
- 配置名称:test(测试集)
特征:
- 名称:源文本(src),数据类型:字符串(string)
- 名称:目标文本(tgt),数据类型:字符串(string)
提供机构:
maas
创建时间:
2025-05-20



