bengisucam/tr_dataset_combined
收藏Hugging Face2023-12-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bengisucam/tr_dataset_combined
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是多个土耳其语数据集的组合,包括BDas/Turkish-Dataset、turkish_product_reviews和winvoker/turkish-sentiment-analysis-dataset。数据集的特征包括文本字段,数据类型为字符串。数据集包含一个训练集分割,共有824,809个样本,总大小为167,603,259字节。
This dataset is the combination of Turkish text datasets, including BDas/Turkish-Dataset, turkish_product_reviews, and winvoker/turkish-sentiment-analysis-dataset. It is primarily used for training, containing 824809 examples with a total size of 167603259 bytes.
提供机构:
bengisucam
原始信息汇总
数据集详情
数据集描述
该数据集是以下数据集的组合:
- BDas/Turkish-Dataset
- turkish_product_reviews
- winvoker/turkish-sentiment-analysis-dataset
数据集信息
-
特征:
- 名称: Text
- 数据类型: string
-
分割:
- 名称: train
- 字节数: 167603259
- 样本数: 824809
-
下载大小: 106342453
-
数据集大小: 167603259
-
配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
-
语言: tr
许可证
- 许可证: apache-2.0



