five

pythainlp/thai-oldbooks

收藏
Hugging Face2024-03-05 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/pythainlp/thai-oldbooks
下载链接
链接失效反馈
官方服务:
资源简介:
Thai Old Books数据集收集了来自Vajirayana图书馆的75本泰语书籍,这些书籍根据泰国法律已过版权保护期(作者去世50年后)。数据集包含作者、书名和文本内容,主要用于文本生成任务。数据集的特征包括作者、书名和文本内容,许可证为CC-0,语言为泰语,任务类别为文本生成,标签为书籍,大小类别为n<1K。

Thai Old Books数据集收集了来自Vajirayana图书馆的75本泰语书籍,这些书籍根据泰国法律已过版权保护期(作者去世50年后)。数据集包含作者、书名和文本内容,主要用于文本生成任务。数据集的特征包括作者、书名和文本内容,许可证为CC-0,语言为泰语,任务类别为文本生成,标签为书籍,大小类别为n<1K。
提供机构:
pythainlp
原始信息汇总

泰国古籍数据集

数据集信息

特征

  • 作者: 字符串类型
  • 书籍: 字符串类型
  • 文本: 字符串类型

分割

  • 训练集:
    • 字节数: 92679341
    • 样本数: 75

大小

  • 下载大小: 34710407 字节
  • 数据集大小: 92679341 字节

配置

  • 默认配置:
    • 数据文件:
      • 分割: 训练集
      • 路径: data/train-*

许可证

  • CC0-1.0

任务类别

  • 文本生成

语言

  • 泰语

标签

  • 书籍

大小类别

  • 小于1K

数据集描述

该数据集收集了来自Vajirayana图书馆的书籍,所有书籍的版权在泰国法律下已过期(作者去世50年后)。

  • 书籍数量: 75本
  • 许可证: CC-0

引用

如果您在项目或出版物中使用了泰国古籍数据集,请按以下方式引用:

bib @dataset{phatthiyaphaibun_2024_10782362, author = {Phatthiyaphaibun, Wannaphong}, title = {Thai Old Books dataset}, month = mar, year = 2024, publisher = {Zenodo}, doi = {10.5281/zenodo.10782362}, url = {https://doi.org/10.5281/zenodo.10782362} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作