five

LingoIITGN/HinGE

收藏
Hugging Face2025-03-20 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/LingoIITGN/HinGE
下载链接
链接失效反馈
官方服务:
资源简介:
HinGE是一个高质量的双语(印地语和英语)代码混合数据集,用于自然语言生成任务。它包含了人类生成的Hinglish句子以及由两个规则基础算法生成的句子,并提供了质量评分。这个数据集由IIT Gandhinagar的Lingo Research Group策划,并采用cc-by-4.0许可证发布。

HinGE is a high-quality bilingual (Hindi and English) code-mixed dataset for natural language generation tasks. It includes human-generated Hinglish sentences as well as sentences generated by two rule-based algorithms, along with quality ratings. This dataset is curated by the Lingo Research Group at IIT Gandhinagar and is released under the cc-by-4.0 license.
提供机构:
LingoIITGN
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作