five

lblommesteyn/nivkh-cultural-heritage-corpus

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/lblommesteyn/nivkh-cultural-heritage-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1,020条高质量记录,记录了尼夫赫语(Nivkh),这是一种极度濒危的语言孤立语,仅存约200名母语者。尼夫赫人生活在俄罗斯远东的阿穆尔河流域和萨哈林岛上。数据集包括810条尼夫赫语记录(民俗、日常生活、教育)、10条英语语言学参考条目和200组对话/会话对,用于语言学习。数据集覆盖了阿穆尔和萨哈林方言。主要语言为尼夫赫语(基于西里尔字母的转写),次要语言为英语(翻译和语言学分析)。

This dataset contains 1,020 high-quality records documenting the Nivkh language, a critically endangered language isolate with approximately 200 native speakers remaining. The Nivkh people live in the Amur River basin and on Sakhalin Island in the Russian Far East. The dataset includes 810 Nivkh language records (folklore, daily life, education), 10 English linguistic reference entries, and 200 dialogue/conversation pairs for language learning. It covers both Amur and Sakhalin dialects. The primary language is Nivkh (Cyrillic-based transcription), and the secondary language is English (translations and linguistic analysis).
提供机构:
lblommesteyn
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作