five

Eesti keele veebilausete korpus 2021

收藏
DataCite Commons2026-03-10 更新2026-05-03 收录
下载链接:
https://metashare.ut.ee/repository/browse/512f8d82a0d411eebb4773db10791bcfdc117fa5ba1249ab8e2b72df2c404215
下载链接
链接失效反馈
官方服务:
资源简介:
Korpus sisaldab "Eesti keele ühendkorpusest 2021" (loe lähemalt Koppel ja Kallas 2022) heade näitelausete tuvastamise tööriista GDEX ehk Good Dictionary Examples (Kilgarriff jt 2008; eesti mooduli kohta Koppel 2020) abil välja valitud lauseid ja "Eesti keele naabersõnade sõnastiku 2019" näitelauseid (loe lähemalt Koppel 2020). Korpus ei sisalda terviktekste. Korpuse suurus on 558 647 923 sõnet, 473 455 876 sõna ja 47 011 383 lauset. Viidatud kirjandus: Kilgarriff, Adam, Milos Husák, Katy McAdam, Michael Rundell, Pavel Rychlý 2008. GDEX: Automatically finding good dictionary examples in a corpus. – Elisenda Bernal, Janet DeCesaris (Eds), Proceedings of the 13th EURALEX International Congress. Barcelona: Institut Universitari de Linguistica Aplicada, Universitat Pompeu Fabra, 425–432. Kallas, Jelena; Kilgarriff, Adam; Koppel, Kristina; Kudritski, Elgar; Langemets, Margit; Michelfeit, Jan; Tuulik, Maria; Viks, Ülle (2015). Automatic generation of the Estonian Collocations Dictionary database. Electronic lexicography in the 21st century: linking lexical data in the digital age. Proceedings of the eLex 2015 conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom.. Ljubljana/Brighton: Trojina, Institute for Applied Slovene Studies/Lexical Computing Ltd, 1−20. Koppel, Kristina (2020). Näitelausete korpuspõhine automaattuvastus eesti keele õppesõnastikele. (Doktoritöö, Tartu Ülikool). Tartu: Tartu Ülikooli Kirjastus. Koppel, Kristina; Kallas, Jelena (2022). Eesti keele ühendkorpuste sari 2013–2021: mahukaim eestikeelsete digitekstide kogu. Eesti Rakenduslingvistika Ühingu aastaraamat 18, [ilmumas].
提供机构:
Center of Estonian Language Resources
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作