IndustryInstruction_Finance-Economics_RankMe_Filter_Regen
收藏魔搭社区2025-12-13 更新2025-01-04 收录
下载链接:
https://modelscope.cn/datasets/BAAI_Industry_Competition_FinEcon_dev/IndustryInstruction_Finance-Economics_RankMe_Filter_Regen
下载链接
链接失效反馈官方服务:
资源简介:
基于[IndustryInstruction_Finance-Economics · 数据集](https://modelscope.cn/datasets/BAAI/IndustryInstruction_Finance-Economics)进行筛选和重新生成后得到的数据集
筛选规则:`deita_score`和` rw_score`均位于前30%的数据
重新生成方法:使用[Qwen2.5-7B-Instruct](https://modelscope.cn/models/Qwen/Qwen2.5-7B-Instruct)模型,先直接生成回答,再用同样的模型将该回答与标准答案进行合并。
合并答案使用的system prompt:
```python
ZH_PROMPT_TEMPLATE = """
###问题:
{question}
###回答1:
{answer1}
###回答2:
{answer2}
###请将以上两个回答合并成一个回答:
"""
EN_PROMPT_TEMPLATE = """
###Question:
{question}
###Answer1:
{answer1}
###Answer2:
{answer2}
###Please combine the above two answers into one answer:
"""
```
本数据集基于[IndustryInstruction_Finance-Economics · 数据集(IndustryInstruction_Finance-Economics Dataset)](https://modelscope.cn/datasets/BAAI/IndustryInstruction_Finance-Economics)经筛选与重新生成流程构建所得。
筛选规则为:仅保留`deita_score`与`rw_score`均处于数据集前30%分位的样本数据。
重新生成方法:采用[Qwen2.5-7B-Instruct](https://modelscope.cn/models/Qwen/Qwen2.5-7B-Instruct)模型,先直接生成候选回答,再通过同一模型将该候选回答与标准答案进行合并。
合并答案所使用的系统提示词如下:
1. 中文提示模板(ZH_PROMPT_TEMPLATE):
python
"""
###问题:
{question}
###回答1:
{answer1}
###回答2:
{answer2}
###请将以上两个回答合并成一个回答:
"""
2. 英文提示模板(EN_PROMPT_TEMPLATE):
python
"""
###Question:
{question}
###Answer1:
{answer1}
###Answer2:
{answer2}
###Please combine the above two answers into one answer:
"""
提供机构:
maas
创建时间:
2024-12-30



