pythainlp/thai-oldbooks
收藏Hugging Face2024-03-05 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/pythainlp/thai-oldbooks
下载链接
链接失效反馈官方服务:
资源简介:
Thai Old Books数据集收集了来自Vajirayana图书馆的75本泰语书籍,这些书籍根据泰国法律已过版权保护期(作者去世50年后)。数据集包含作者、书名和文本内容,主要用于文本生成任务。数据集的特征包括作者、书名和文本内容,许可证为CC-0,语言为泰语,任务类别为文本生成,标签为书籍,大小类别为n<1K。
Thai Old Books数据集收集了来自Vajirayana图书馆的75本泰语书籍,这些书籍根据泰国法律已过版权保护期(作者去世50年后)。数据集包含作者、书名和文本内容,主要用于文本生成任务。数据集的特征包括作者、书名和文本内容,许可证为CC-0,语言为泰语,任务类别为文本生成,标签为书籍,大小类别为n<1K。
提供机构:
pythainlp
原始信息汇总
泰国古籍数据集
数据集信息
特征
- 作者: 字符串类型
- 书籍: 字符串类型
- 文本: 字符串类型
分割
- 训练集:
- 字节数: 92679341
- 样本数: 75
大小
- 下载大小: 34710407 字节
- 数据集大小: 92679341 字节
配置
- 默认配置:
- 数据文件:
- 分割: 训练集
- 路径: data/train-*
- 数据文件:
许可证
- CC0-1.0
任务类别
- 文本生成
语言
- 泰语
标签
- 书籍
大小类别
- 小于1K
数据集描述
该数据集收集了来自Vajirayana图书馆的书籍,所有书籍的版权在泰国法律下已过期(作者去世50年后)。
- 书籍数量: 75本
- 许可证: CC-0
引用
如果您在项目或出版物中使用了泰国古籍数据集,请按以下方式引用:
bib @dataset{phatthiyaphaibun_2024_10782362, author = {Phatthiyaphaibun, Wannaphong}, title = {Thai Old Books dataset}, month = mar, year = 2024, publisher = {Zenodo}, doi = {10.5281/zenodo.10782362}, url = {https://doi.org/10.5281/zenodo.10782362} }



