NLI-PT
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NLI-PT
下载链接
链接失效反馈官方服务:
资源简介:
为母语识别 (NLI) 编译的第一个葡萄牙语数据集,该任务根据作者的第二语言写作来识别作者的第一语言。该数据集包括 1,868 篇由欧洲葡萄牙语学习者、以以下 L1 为母语的学生撰写的论文:中文、英语、西班牙语、德语、俄语、法语、日语、意大利语、荷兰语、德顿语、阿拉伯语、波兰语、韩语、罗马尼亚语和瑞典语. NLI-PT 包括原始学生文本和四种不同类型的注释:POS、细粒度 POS、选区解析和依赖解析。 NLI-PT 不仅可以用于 NLI,还可以用于第二语言习得和教育 NLP 领域的多个主题的研究。
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
NLI-PT是首个用于母语识别任务的葡萄牙语数据集,包含1,868篇由欧洲葡萄牙语学习者撰写的文章,覆盖15种不同母语背景。该数据集提供原始文本和多种语言注释,适用于母语识别、第二语言习得和教育NLP等领域的研究。
以上内容由遇见数据集搜集并总结生成



