ChineseDomainModelingEval
收藏魔搭社区2025-12-05 更新2025-02-22 收录
下载链接:
https://modelscope.cn/datasets/Skywork/ChineseDomainModelingEval
下载链接
链接失效反馈官方服务:
资源简介:
# 数据介绍(Introduction)
Skywork/ChineseDomainModelingEval是中文领域建模能力评测数据集,我们对多个领域筛选出2023年9月份-2023年10月份新发布的几百到上千篇高质量文章,并人工进行了核对。测试数据的来源也足够广泛,质量也高。我们可以选取当前最新的文章评测不同模型的Perplexity,模型很难作弊。并且我们会持续按照最新数据评测各个模型效果,动态更新各个模型能力。
# 文件介绍(File Introduction)
- zh_finance.jsonl为金融领域评估数据
- zh_game.jsonl为游戏领域评估数据
- zh_government.jsonl为政务领域评估数据
- zh_movie.jsonl为电影领域评估数据
- zh_tech.jsonl为技术领域评估数据
- zh_general.jsonl为综合领域评估数据
# 协议(License Agreement)
The community usage of SkyPile dataset requires Skywork Community License. The SkyPile dataset supports commercial use. If you plan to use the Skywork model or its derivatives for commercial purposes, you must abide by terms and conditions within Skywork Community License as well as Apache2.0.
# 引用(Contact Us and Citation)
If you find our work helpful, please feel free to cite our paper~
```
@misc{wei2023skywork,
title={Skywork: A More Open Bilingual Foundation Model},
author={Tianwen Wei and Liang Zhao and Lichang Zhang and Bo Zhu and Lijie Wang and Haihua Yang and Biye Li and Cheng Cheng and Weiwei Lü and Rui Hu and Chenxia Li and Liu Yang and Xilin Luo and Xuejie Wu and Lunan Liu and Wenjun Cheng and Peng Cheng and Jianhao Zhang and Xiaoyu Zhang and Lei Lin and Xiaokun Wang and Yutuan Ma and Chuanhai Dong and Yanqi Sun and Yifu Chen and Yongyi Peng and Xiaojuan Liang and Shuicheng Yan and Han Fang and Yahui Zhou},
year={2023},
eprint={2310.19341},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
# 数据介绍(Introduction)
Skywork/ChineseDomainModelingEval 是面向中文领域建模能力的评测数据集。我们从多个领域中筛选出2023年9月至2023年10月新发布的数百至千余篇高质量文章,并经人工核验确保数据质量。本测试数据集来源广泛且质量上乘,可依托当前最新的文章对不同模型的困惑度(Perplexity)进行评测,模型难以通过作弊手段获得理想结果。此外,我们将持续基于最新数据对各类模型进行评测,并动态更新各模型的能力评估结果。
# 文件介绍(File Introduction)
- `zh_finance.jsonl` 为金融领域评估数据集
- `zh_game.jsonl` 为游戏领域评估数据集
- `zh_government.jsonl` 为政务领域评估数据集
- `zh_movie.jsonl` 为电影领域评估数据集
- `zh_tech.jsonl` 为技术领域评估数据集
- `zh_general.jsonl` 为综合领域评估数据集
# 协议(License Agreement)
SkyPile 数据集的社区使用需遵循 Skywork 社区许可协议(Skywork Community License)。该数据集支持商业使用,若您计划将 Skywork 模型及其衍生产品用于商业用途,则必须同时遵守 Skywork 社区许可协议与 Apache 2.0 协议的相关条款。
# 引用(Contact Us and Citation)
若您认为本研究对您有所帮助,欢迎引用我们的论文:
@misc{wei2023skywork,
title={"Skywork: A More Open Bilingual Foundation Model"},
author={Tianwen Wei and Liang Zhao and Lichang Zhang and Bo Zhu and Lijie Wang and Haihua Yang and Biye Li and Cheng Cheng and Weiwei Lü and Rui Hu and Chenxia Li and Liu Yang and Xilin Luo and Xuejie Wu and Lunan Liu and Wenjun Cheng and Peng Cheng and Jianhao Zhang and Xiaoyu Zhang and Lei Lin and Xiaokun Wang and Yutuan Ma and Chuanhai Dong and Yanqi Sun and Yifu Chen and Yongyi Peng and Xiaojuan Liang and Shuicheng Yan and Han Fang and Yahui Zhou},
year={2023},
eprint={2310.19341},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
提供机构:
maas
创建时间:
2025-02-19
搜集汇总
数据集介绍

背景与挑战
背景概述
ChineseDomainModelingEval是一个中文领域建模能力评测数据集,包含2023年9月至10月多个领域的高质量文章,用于评估不同模型的Perplexity。数据集涵盖金融、游戏、政务、电影、技术和综合领域,支持商业用途,遵循Skywork Community License和Apache2.0协议。
以上内容由遇见数据集搜集并总结生成



