denizzhansahin/10K-TR-Sport-April-2024
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/denizzhansahin/10K-TR-Sport-April-2024
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从FutbolArena网站获取的足球相关文章,获取日期为2024年4月28日。数据集分为训练集和验证集,分别包含8009和3433个样本。每个样本包含六个特征:Unnamed: 0(整数类型)、Baslik(文章标题,字符串类型)、Ozet(文章摘要,字符串类型)、Kategori(文章类别,字符串类型)、Link(文章链接,字符串类型)和Icerik(文章内容,字符串类型)。数据集的总大小为27200787字节,下载大小为14109589字节。
该数据集包含从FutbolArena网站获取的足球相关文章,获取日期为2024年4月28日。数据集分为训练集和验证集,分别包含8009和3433个样本。每个样本包含六个特征:Unnamed: 0(整数类型)、Baslik(文章标题,字符串类型)、Ozet(文章摘要,字符串类型)、Kategori(文章类别,字符串类型)、Link(文章链接,字符串类型)和Icerik(文章内容,字符串类型)。数据集的总大小为27200787字节,下载大小为14109589字节。
提供机构:
denizzhansahin
原始信息汇总
数据集概述
配置信息
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 验证集: data/validation-*
数据集特征
- Unnamed: 0: 数据类型为 int64
- Baslik: 数据类型为 string
- Ozet: 数据类型为 string
- Kategori: 数据类型为 string
- Link: 数据类型为 string
- Icerik: 数据类型为 string
数据集大小
- 下载大小: 14109589 字节
- 数据集总大小: 27200787.0 字节
数据集分割详情
- 训练集:
- 大小: 19039599.989774514 字节
- 示例数量: 8009
- 验证集:
- 大小: 8161187.010225485 字节
- 示例数量: 3433



