tlc
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/tlc?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
Thai Literature Corpora (TLC) 旨在提供可供机器处理的泰国古典文学文本语料库。它包含两个数据集:TLC 集,来源于 Vajirayana 数字图书馆,按章节和诗节存储(未分词);以及 TNHC 集,来源于泰国国家历史语料库,按行存储(手动分词)。该语料库支持语言建模和生成等任务。数据集中包含章节号、标题和文本等字段,并提供标准化数据操作。该语料库由朱拉隆功大学的 Jitkapat Sawatphol 和 Attapol Rutherford 负责维护。
提供机构:
AIWizards
创建时间:
2024-07-19



