five

LingoIITGN/PHINC

收藏
Hugging Face2025-03-20 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/LingoIITGN/PHINC
下载链接
链接失效反馈
官方服务:
资源简介:
PHINC(平行Hinglish社交媒体代码混合语料库)是一个针对机器翻译的低资源任务的手动注释的13,738个Hinglish-英语句子对的数据集。该数据集旨在解决翻译带噪声、非正式、代码混合的社交媒体文本的挑战。

PHINC (Parallel Hinglish Social Media Code-Mixed Corpus for Machine Translation) is a dataset of 13,738 manually annotated Hinglish-English sentence pairs for the low-resource machine translation task, designed to address the challenges of translating noisy, informal, code-mixed social media text.
提供机构:
LingoIITGN
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作