five

leklek02/alpaca_pangasinan

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/leklek02/alpaca_pangasinan
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是原始Alpaca指令跟随数据集的**Pangasinan语翻译**版本,旨在支持低资源菲律宾语言(特别是Pangasinan语)的指令调优语言模型的研究和开发。数据集保留了原始Alpaca的结构,同时提供了高质量的指令、输入和输出的翻译。每个示例包含Pangasinan语的指令、可选上下文和预期响应。数据集创建过程包括机器翻译和人工后期编辑,可能存在翻译伪影或文化细微差别未完全保留的局限性。适用于Pangasinan语的指令调优、多语言NLP研究、低资源语言建模以及为Pangasinan语使用者开发的聊天机器人和助手。

This dataset is a **Pangasinan translation** of the original Alpaca instruction-following dataset. It is designed to support research and development of **instruction-tuned language models** for low-resource Philippine languages, particularly Pangasinan. The dataset retains the original Alpaca structure while providing high-quality translations of instructions, inputs, and outputs. Each example includes an instruction, optional context, and expected response in Pangasinan. The dataset creation involved machine translation and human post-editing, with potential limitations such as translation artifacts and cultural nuances not always preserved. It is intended for instruction tuning of LLMs in Pangasinan, multilingual NLP research, low-resource language modeling, and chatbot and assistant development for Pangasinan speakers.
提供机构:
leklek02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作