CCPM
收藏魔搭社区2025-11-19 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/CCPM
下载链接
链接失效反馈官方服务:
资源简介:
displayName: CCPM (Chinese Classical Poetry Matching)
license:
- Unknown
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2106.01979v1.pdf
publishDate: "2021"
publishUrl: https://github.com/THUNLP-AIPoet/CCPM
publisher:
- Tsinghua University
- Beijing National Research Center for Information Science and Technology
tags:
- Poems
---
# 数据集介绍
## 简介
介绍
CCPM是一个大型的中国古典诗歌匹配数据集,可用于诗歌匹配、理解和翻译。
该数据集的主要任务是:给定现代汉语的描述,该模型应该从四个候选中选择与给定描述在语义上最匹配的一行中国古典诗歌。
尺寸
它总共包含 27,218 个实例,分为训练 (21,778)、验证 (2,720) 和测试 (2,720) 集。
格式
每个实例由翻译(现代汉语描述,一个字符串)、选择(中国古典诗歌四个候选行,一个列表)和答案(正确行的索引,0到3之间的整数)组成。
## 引文
```
@article{li2021ccpm,
title={Ccpm: A chinese classical poetry matching dataset},
author={Li, Wenhao and Qi, Fanchao and Sun, Maosong and Yi, Xiaoyuan and Zhang, Jiarui},
journal={arXiv preprint arXiv:2106.01979},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
展示名称:CCPM(中国古典诗歌匹配,Chinese Classical Poetry Matching)
许可协议:未知
媒体类型:文本
论文链接:https://arxiv.org/pdf/2106.01979v1.pdf
发布日期:2021年
发布地址:https://github.com/THUNLP-AIPoet/CCPM
发布机构:清华大学(Tsinghua University)、北京国家信息科学技术研究中心(Beijing National Research Center for Information Science and Technology)
标签:诗歌(Poems)
---
# 数据集介绍
## 简介
CCPM是一款大型中国古典诗歌匹配数据集,可应用于诗歌匹配、理解与翻译任务。
该数据集的核心任务为:给定一条现代汉语描述,模型需从四个候选诗句中选出与该描述语义匹配度最高的一行中国古典诗歌。
## 数据规模
该数据集共计包含27218条实例,划分为训练集(21778条)、验证集(2720条)与测试集(2720条)。
## 数据格式
每条实例由三部分构成:输入文本(即现代汉语描述,为字符串类型)、候选诗句集(包含四首中国古典诗歌诗句的列表)与答案(即正确诗句的索引,取值为0至3之间的整数)。
## 引文
@article{li2021ccpm,
title={Ccpm: A chinese classical poetry matching dataset},
author={Li, Wenhao and Qi, Fanchao and Sun, Maosong and Yi, Xiaoyuan and Zhang, Jiarui},
journal={arXiv preprint arXiv:2106.01979},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
搜集汇总
数据集介绍

背景与挑战
背景概述
CCPM是一个大规模的中国古典诗歌匹配数据集,包含27,218个实例,用于诗歌匹配、理解和翻译任务。每个实例包括现代汉语描述、四个候选诗句和正确答案索引,适用于训练模型进行语义匹配。
以上内容由遇见数据集搜集并总结生成



