Couplet 中国对联数据集
收藏Data Castle2022-09-01 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=2207
下载链接
链接失效反馈官方服务:
资源简介:
#### 背景描述
该数据集包含了超过70万副的中文对联数据。
#### 数据说明
train_in.txt: 对联的上联。每行都是一个输入,每个词都用空格隔开。(训练集的输入) train_out.txt:对联的下联。每行都是一个输出。对应着 train_in.txt的每一行。每个词都用空格隔开。 (训练集的输出) test_in.txt : 对联的上联。每行都是一个输入,每个词都用空格隔开。(测试集的输入) test_out.txt : 对联的下联。每行都是一个输出。对应着test_in.txt的每一行。每个词都用空格隔开。 (测试集的输出) vocabs: 词汇文件。 添加<s>和<\s>作为第一个vocabs,它将用于在seq2seq模式下进行训练。
#### 数据来源
https://github.com/wb14123/couplet-dataset
#### 问题描述
文本分析
提供机构:
keys



