five

LCQMC (Large-scale Chinese Question Matching Corpus)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/LCQMC
下载链接
链接失效反馈
官方服务:
资源简介:
问题匹配是 QA 的一项基本任务,通常被认为是语义匹配任务,有时是释义识别任务。该任务的目标是从现有数据库中搜索与输入问题具有相似意图的问题。我们引入了一个大规模的中文问题匹配语料库(名为 LCQMC)。 LCQMC 比释义语料库更通用,因为它侧重于意图匹配而不是释义。语料库包含 260,068 个带有人工注释的问题对,我们将其分为三部分,即包含 238,766 个问题对的训练集、包含 8,802 个问题对的开发集和包含 12,500 个问题对的测试集。我们在上面测试了几种著名的句子匹配方法。实验结果不仅证明了 LCQMC 的良好质量,而且为进一步研究该语料库提供了可靠的基线性能。
提供机构:
OpenDataLab
创建时间:
2022-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作