Slovene SCD
收藏arXiv2024-02-26 更新2024-06-21 收录
下载链接:
http://hdl.handle.net/11356/1651
下载链接
链接失效反馈官方服务:
资源简介:
Slovene SCD是首个针对斯洛文尼亚语的语义变化检测数据集,由约瑟夫·斯蒂芬研究所创建。该数据集包含104个目标词,这些词从超过3000个手动注释的句子对中获得,用于评估语义变化检测系统。数据集覆盖了两个时间段,分别是1990-1997年和2018年,从斯洛文尼亚参考语料库Gigafida 2.0中提取。创建过程中,研究人员通过自动变化检测系统筛选出候选词,并由两位母语者手动检查和选择,确保了数据集的质量和多样性。该数据集主要用于解决语义变化检测的问题,特别是在自然语言处理任务中,如提高当前上下文语言模型的时间敏感性。
提供机构:
约瑟夫·斯蒂芬研究所
创建时间:
2024-02-26



