EKI veamärgendatud E2 õppijakorpus (versioon 2)
收藏DataCite Commons2026-03-11 更新2026-05-03 收录
下载链接:
https://metashare.ut.ee/repository/browse/c288a923adb211f0995d85c1a1e4f83d50a9731dfb3147a387758f68e8f0840f
下载链接
链接失效反馈官方服务:
资源简介:
Veamärgendatud korpuse materjalid põhinevad EMMA õppijakeelekorpusel, sisaldades andmeid Haridus- ja Noorteameti tasemetöödest (7. klass, 504 teksti), põhikooli lõpueksamitest (9. klass, 501 teksti) ja riigieksamitest (12. klass, 998 teksti). Korpusmaterjali on väärindatud lisades käsitsimärgendamisel veamärgenduskihi, mis võimaldab analüüsida eesti keel teise keelena õppijate keelekasutust ja tüüpilisi veakohti. Kasutatud on ERRANT-M2 veamärgendusskeemi. Korpusese kogumaht on 2003 teksti. Eesmärk on korpust järjepidevalt täiendada ja selle mahtu suurendada uute materjalidega.
Märgenduskihtidena sisaldab korpus käsitsimärgendusel põhinevat veamärgenduskihti ja automaatmärgendusel põhinevat grammatikakihti. Grammatilise märgenduse jaoks on kasutatud UDpipe parserit.
提供机构:
Eesti Keele Instituut
创建时间:
2025-10-20



