five

Eesti keele puudepank

收藏
DataCite Commons2026-03-11 更新2026-05-03 收录
下载链接:
https://metashare.ut.ee/repository/browse/1ac6f18a15b511e5a6e4005056b40024941ed544fc2843589d19d6db77c1461b
下载链接
链接失效反馈
官方服务:
资源简介:
Morfoloogiliselt ja sõltuvussüntaktiliselt analüüsitud eestikeelsed tekstid, kokku umbes 400 000 sõna 30 000 lauses. Tekstid on pärit eesti keele Tasakaalus korpusest http://www.cl.ut.ee/korpused/grammatikakorpus/ ja Koondkorpusest http://www.cl.ut.ee/korpused/segakorpus/ ning jagunevad ilukirjanduse, ajakirjanduse, teaduse ja populaarteaduse tekstiklasside vahel. Tekstid on esmalt analüüsitud reeglipõhise, kitsenduste grammatikal põhineva sõltuvussüntaktilise analüsaatoriga; automaatselt analüüsitud faile on parandatud käsitsi. Publikatsioon: Muischnek, Kadri; Müürisep, Kaili; Puolakainen Tiina (2014). Dependency Parsing of Estonian : Statistical and Rule - based Approaches Human Language Technologies - The Baltic Perspective. Frontiers in Artificial Intelligence and Applications Vol 268. IOS Press, Amsterdam, pp. 111-118. "
提供机构:
Center of Estonian Language Resources
创建时间:
2015-06-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作