pythainlp/thai-constitution-corpus
收藏Hugging Face2024-03-05 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/pythainlp/thai-constitution-corpus
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: name
dtype: string
- name: txt
dtype: string
splits:
- name: train
num_bytes: 3928240
num_examples: 20
download_size: 1138704
dataset_size: 3928240
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
license: cc0-1.0
task_categories:
- text-generation
language:
- th
tags:
- law
size_categories:
- n<1K
---
# Thai Constitution Corpus
Thai Constitution Corpus
GitHub: [https://github.com/PyThaiNLP/Thai-constitution-corpus](https://github.com/PyThaiNLP/Thai-constitution-corpus)
## English
The Constitution of Thailand Dataset Since 1932
- Data from [Office of the Council of State](http://www.krisdika.go.th)
- This part of PyThaiNLP Project.
- License Dataset is public domain.
## Thai
คลังรัฐธรรมนูญของประเทศไทย ตั้งแต่ปี พ.ศ.2475
- ข้อมูลเก็บรวบรวมมาจาก [สำนักงานคณะกรรมการกฤษฎีกา](http://www.krisdika.go.th)
- โครงการนี้เป็นส่วนหนึ่งในแผนพัฒนา [PyThaiNLP](https://github.com/PyThaiNLP/)
- ข้อมูลที่รวบรวมในคลังข้อความนี้เป็นสาธารณสมบัติ (public domain) ตามพ.ร.บ.ลิขสิทธิ์ พ.ศ. 2537 มาตรา 7 (สิ่งต่อไปนี้ไม่ถือว่าเป็นงานอันมีลิขสิทธิ์ตามพระราชบัญญัตินี้ (1) ข่าวประจำวัน และข้อเท็จจริงต่างๆ ที่มีลักษณะเป็นเพียงข่าวสารอันมิใช่งานในแผนกวรรณคดี แผนกวิทยาศาสตร์ หรือแผนกศิลปะ [...] (3) ระเบียบ ข้อบังคับ ประกาศ คำสั่ง คำชี้แจง และหนังสือตอบโต้ของกระทรวง ทบวง กรม หรือหน่วยงานอื่นใดของรัฐหรือของท้องถิ่น [...])
- โครงการนี้ไม่เกี่ยวข้องกับนโยบายของรัฐ และ ไม่มีส่วนเกี่ยวข้องกับ Thailand 4.0
รวบรวมโดย นาย วรรณพงษ์ ภัททิยไพบูลย์
นักศึกษาชั้นปีที่ 4
สาขาวิทยาการคอมพิวเตอร์และสารสนเทศ
คณะสหวิทยาการ
มหาวิทยาลัยขอนแก่น
wannaphong@kkumail.com
提供机构:
pythainlp
原始信息汇总
泰国宪法语料库
数据集信息
特征
- name: 字符串类型
- txt: 字符串类型
数据分割
- train:
- 字节数: 3928240
- 样本数: 20
下载和数据集大小
- 下载大小: 1138704 字节
- 数据集大小: 3928240 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
许可证
- license: cc0-1.0
任务类别
- text-generation
语言
- th
标签
- law
大小类别
- n<1K



