Eesti keele veebilausete korpus 2021

Name: Eesti keele veebilausete korpus 2021
Creator: Center of Estonian Language Resources
Published: 2026-03-10 11:20:18
License: 暂无描述

DataCite Commons2026-03-10 更新2026-05-03 收录

下载链接：

https://metashare.ut.ee/repository/browse/512f8d82a0d411eebb4773db10791bcfdc117fa5ba1249ab8e2b72df2c404215

下载链接

链接失效反馈

官方服务：

资源简介：

Korpus sisaldab "Eesti keele ühendkorpusest 2021" (loe lähemalt Koppel ja Kallas 2022) heade näitelausete tuvastamise tööriista GDEX ehk Good Dictionary Examples (Kilgarriff jt 2008; eesti mooduli kohta Koppel 2020) abil välja valitud lauseid ja "Eesti keele naabersõnade sõnastiku 2019" näitelauseid (loe lähemalt Koppel 2020). Korpus ei sisalda terviktekste. Korpuse suurus on 558 647 923 sõnet, 473 455 876 sõna ja 47 011 383 lauset. Viidatud kirjandus: Kilgarriff, Adam, Milos Husák, Katy McAdam, Michael Rundell, Pavel Rychlý 2008. GDEX: Automatically finding good dictionary examples in a corpus. – Elisenda Bernal, Janet DeCesaris (Eds), Proceedings of the 13th EURALEX International Congress. Barcelona: Institut Universitari de Linguistica Aplicada, Universitat Pompeu Fabra, 425–432. Kallas, Jelena; Kilgarriff, Adam; Koppel, Kristina; Kudritski, Elgar; Langemets, Margit; Michelfeit, Jan; Tuulik, Maria; Viks, Ülle (2015). Automatic generation of the Estonian Collocations Dictionary database. Electronic lexicography in the 21st century: linking lexical data in the digital age. Proceedings of the eLex 2015 conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom.. Ljubljana/Brighton: Trojina, Institute for Applied Slovene Studies/Lexical Computing Ltd, 1−20. Koppel, Kristina (2020). Näitelausete korpuspõhine automaattuvastus eesti keele õppesõnastikele. (Doktoritöö, Tartu Ülikool). Tartu: Tartu Ülikooli Kirjastus. Koppel, Kristina; Kallas, Jelena (2022). Eesti keele ühendkorpuste sari 2013–2021: mahukaim eestikeelsete digitekstide kogu. Eesti Rakenduslingvistika Ühingu aastaraamat 18, [ilmumas].

提供机构：

Center of Estonian Language Resources

创建时间：

2022-05-23

5,000+

优质数据集

54 个

任务类型

进入经典数据集