habanoz/news-tr-90k
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/habanoz/news-tr-90k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含90K土耳其语新闻文章。数据来源于CommonCrawl。免责声明:数据提取自Common Crawl,作者不拥有数据,且不允许商业使用。
The dataset contains 90K news articles in Turkish. The data is obtained from CommonCrawl. Disclaimer: Data is extracted from Common Crawl. I do not own the data. Commercial use is not allowed.
提供机构:
habanoz
原始信息汇总
数据集概述
数据集信息
- 数据集名称: News Articles in Turkish
- 数据来源: CommonCrawl
- 数据集大小: 329,181,820 字节
- 下载大小: 173,767,121 字节
数据特征
- Id: 整数类型
- Tag: 字符串类型
- Labels: 字符串类型
- Title: 字符串类型
- Summary: 字符串类型
- Text: 字符串类型
- index_level_0: 整数类型
数据分割
- 训练集:
- 样本数量: 90,787
- 字节数: 329,181,820
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
注意事项
- 数据集包含90K篇土耳其语新闻文章。
- 数据提取自Common Crawl,作者不拥有数据,禁止商业使用。



