five

EKI veamärgendatud E2 õppijakorpus (versioon 2)

收藏
DataCite Commons2026-03-11 更新2026-05-03 收录
下载链接:
https://metashare.ut.ee/repository/browse/c288a923adb211f0995d85c1a1e4f83d50a9731dfb3147a387758f68e8f0840f
下载链接
链接失效反馈
官方服务:
资源简介:
Veamärgendatud korpuse materjalid põhinevad EMMA õppijakeelekorpusel, sisaldades andmeid Haridus- ja Noorteameti tasemetöödest (7. klass, 504 teksti), põhikooli lõpueksamitest (9. klass, 501 teksti) ja riigieksamitest (12. klass, 998 teksti). Korpusmaterjali on väärindatud lisades käsitsimärgendamisel veamärgenduskihi, mis võimaldab analüüsida eesti keel teise keelena õppijate keelekasutust ja tüüpilisi veakohti. Kasutatud on ERRANT-M2 veamärgendusskeemi. Korpusese kogumaht on 2003 teksti. Eesmärk on korpust järjepidevalt täiendada ja selle mahtu suurendada uute materjalidega. Märgenduskihtidena sisaldab korpus käsitsimärgendusel põhinevat veamärgenduskihti ja automaatmärgendusel põhinevat grammatikakihti. Grammatilise märgenduse jaoks on kasutatud UDpipe parserit.
提供机构:
Eesti Keele Instituut
创建时间:
2025-10-20
二维码
社区交流群
二维码
科研交流群
商业服务