five

pythainlp/thai-sent-local-v2

收藏
Hugging Face2025-08-01 更新2025-08-09 收录
下载链接:
https://hf-mirror.com/datasets/pythainlp/thai-sent-local-v2
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含四种泰地方言(korat、pattani、khummuang和isan)的文本生成数据集,用于训练模型进行文本生成任务。数据集由训练集组成,包含2034个样本,每个样本包括输入字符串和目标字符串。数据集的来源包括不同方言的词典和句子,来自于多个网站,并遵循cc-by-4.0许可。

This is a text generation dataset containing four Thai local dialects (korat, pattani, khummuang, and isan) for training models on text generation tasks. The dataset consists of a training set with 2034 samples, each including an input string and a target string. The sources of the dataset include dictionaries and sentences in different dialects from multiple websites, licensed under cc-by-4.0.
提供机构:
pythainlp
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作