five

NLI-PT

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NLI-PT
下载链接
链接失效反馈
官方服务:
资源简介:
为母语识别 (NLI) 编译的第一个葡萄牙语数据集,该任务根据作者的第二语言写作来识别作者的第一语言。该数据集包括 1,868 篇由欧洲葡萄牙语学习者、以以下 L1 为母语的学生撰写的论文:中文、英语、西班牙语、德语、俄语、法语、日语、意大利语、荷兰语、德顿语、阿拉伯语、波兰语、韩语、罗马尼亚语和瑞典语. NLI-PT 包括原始学生文本和四种不同类型的注释:POS、细粒度 POS、选区解析和依赖解析。 NLI-PT 不仅可以用于 NLI,还可以用于第二语言习得和教育 NLP 领域的多个主题的研究。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NLI-PT是首个用于母语识别任务的葡萄牙语数据集,包含1,868篇由欧洲葡萄牙语学习者撰写的文章,覆盖15种不同母语背景。该数据集提供原始文本和多种语言注释,适用于母语识别、第二语言习得和教育NLP等领域的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作