five

The MultiplEYE Text Corpus Data and Materials

收藏
DataCite Commons2026-03-11 更新2026-05-04 收录
下载链接:
https://www.psycharchives.org/jspui/handle/20.500.12034/17126
下载链接
链接失效反馈
官方服务:
资源简介:
Data and materials for the 39 language versions of the MultiplEYE Text Corpus pertaining to Kaspere, Bondar, Nisioi, Stegenwallner-Schütz et al. (2026). Text Corpus: Towards a Diverse and Ever-Expanding Multilingual Text Corpus. Proceedings of the 15th Language Resources and Evaluation Conference (LREC 2026). European Language Resources Association. For each language version, the repository includes three file types: (1) a stimuli-experiment file containing paginated stimulus texts, (2) a metadata file containing bibliographic and provenance information for each text, and (3) token-level linguistic annotation files. In addition, the repository provides (4) a pagination correspondence table documenting the alignment between each language version's pagination and the English reference pagination, and (5) a language coordinator list identifying the individuals coordinating the compilation of texts for each language version of the MultiplEYE Text Corpus.

本数据集收录对应Kaspere、Bondar、Nisioi、Stegenwallner-Schütz等学者(2026年)研究的MultiplEYE文本语料库(MultiplEYE Text Corpus)的39种语言版本的数据与配套材料。该语料库相关研究论文题为《Towards a Diverse and Ever-Expanding Multilingual Text Corpus》,收录于第15届国际语言资源与评价会议(15th Language Resources and Evaluation Conference, LREC 2026)论文集,由欧洲语言资源协会(European Language Resources Association)出版。针对每种语言版本,本数据集仓库共包含三类基础文件:(1)刺激实验文件,内含分页排版的实验刺激文本;(2)元数据文件,收录每篇文本的文献著录信息与来源溯源信息;(3)词元(Token)级语言标注文件。此外,本仓库还额外提供两类辅助文件:(4)分页对应对照表,记录各语言版本的分页与英文参考分页之间的对齐关系;(5)语言协调员名录,列明负责协调MultiplEYE文本语料库各语言版本文本汇编工作的相关人员。
提供机构:
PsychArchives
创建时间:
2026-03-11
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作