five

Hindi-Aesthetics-Corpus

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Aesthetics_Text_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该语料库由用印地语编写的小说和短篇小说组成。我们从圣雄甘地·安塔拉什特里亚·辛迪瓦·维迪亚亚 (译为圣雄甘地国际印地语大学) 维护的电子图书馆http://hindisamay.com,http://premchand.co.in,一个致力于流行小说家premchand故事的网站,和Bhandarkar东方研究所的数字图书馆 (http://borilib.com)。作为预处理步骤,我们将文本拆分为句子,并删除了特殊字符,英语令牌和拉丁数字。
提供机构:
OpenDataLab
创建时间:
2022-06-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作