five

Slovene SCD

收藏
arXiv2024-02-26 更新2024-06-21 收录
下载链接:
http://hdl.handle.net/11356/1651
下载链接
链接失效反馈
官方服务:
资源简介:
Slovene SCD是首个针对斯洛文尼亚语的语义变化检测数据集,由约瑟夫·斯蒂芬研究所创建。该数据集包含104个目标词,这些词从超过3000个手动注释的句子对中获得,用于评估语义变化检测系统。数据集覆盖了两个时间段,分别是1990-1997年和2018年,从斯洛文尼亚参考语料库Gigafida 2.0中提取。创建过程中,研究人员通过自动变化检测系统筛选出候选词,并由两位母语者手动检查和选择,确保了数据集的质量和多样性。该数据集主要用于解决语义变化检测的问题,特别是在自然语言处理任务中,如提高当前上下文语言模型的时间敏感性。
提供机构:
约瑟夫·斯蒂芬研究所
创建时间:
2024-02-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作