five

tlc

收藏
OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/tlc?tab=summary
下载链接
链接失效反馈
官方服务:
资源简介:
Thai Literature Corpora (TLC) 旨在提供可供机器处理的泰国古典文学文本语料库。它包含两个数据集:TLC 集,来源于 Vajirayana 数字图书馆,按章节和诗节存储(未分词);以及 TNHC 集,来源于泰国国家历史语料库,按行存储(手动分词)。该语料库支持语言建模和生成等任务。数据集中包含章节号、标题和文本等字段,并提供标准化数据操作。该语料库由朱拉隆功大学的 Jitkapat Sawatphol 和 Attapol Rutherford 负责维护。
提供机构:
AIWizards
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作