PlanTL-GOB-ES/sts-es
收藏数据集概述
名称: STS-es
语言: 西班牙语 (es-ES)
任务类别: 文本分类
任务ID:
- 语义相似度评分
- 文本评分
数据集结构:
-
数据实例:
{ sentence1: String, sentence2: String, label: Float }
-
数据字段:
- sentence1: 字符串
- sentence2: 字符串
- label: 浮点数
-
数据分割:
- 训练集: 1,321 实例
- 开发集: 78 实例
- 测试集: 156 实例
数据集创建:
- 源数据: 来自西班牙维基百科(2013年数据)和西班牙新闻文本(2014年)
- 注释过程: 专家生成
使用数据注意事项:
- 社会影响: 促进西班牙语语言模型的发展
- 偏见讨论: 未应用后处理步骤以减轻潜在的社会偏见
引用信息:
@inproceedings{agirre2015semeval, title={Semeval-2015 task 2: Semantic textual similarity, english, spanish and pilot on interpretability}, author={Agirre, Eneko and Banea, Carmen and Cardie, Claire and Cer, Daniel and Diab, Mona and Gonzalez-Agirre, Aitor and Guo, Weiwei and Lopez-Gazpio, Inigo and Maritxalar, Montse and Mihalcea, Rada and others}, booktitle={Proceedings of the 9th international workshop on semantic evaluation (SemEval 2015)}, pages={252--263}, year={2015} }
@inproceedings{agirre2014semeval, title={SemEval-2014 Task 10: Multilingual Semantic Textual Similarity.}, author={Agirre, Eneko and Banea, Carmen and Cardie, Claire and Cer, Daniel M and Diab, Mona T and Gonzalez-Agirre, Aitor and Guo, Weiwei and Mihalcea, Rada and Rigau, German and Wiebe, Janyce}, booktitle={SemEval@ COLING}, pages={81--91}, year={2014} }



