SICK (Sentences Involving Compositional Knowledge)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/SICK
下载链接
链接失效反馈官方服务:
资源简介:
涉及组合知识的句子 (SICK) 数据集是用于组合分布语义的数据集。它包含大量丰富的词法、句法和语义现象的句对。每对句子都在两个维度上进行注释:相关性和蕴涵性。关联度评分范围为 1 到 5,使用 Pearson 的 r 进行评估;蕴涵关系是范畴的,由蕴涵、矛盾和中性组成。训练拆分中有 4439 对,用于开发的试用拆分中有 495 对,测试拆分中有 4906 对。句子对是从图像和视频字幕数据集生成的,然后使用某种算法进行配对。
提供机构:
OpenDataLab
创建时间:
2022-05-23



