berquetR/dlab_project_optimal_links
收藏Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/berquetR/dlab_project_optimal_links
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如来源、目标、当前页面、当前页面链接、下一页和索引级别0。数据集分为训练集、验证集和测试集,分别包含78088、26178和26193个样本。数据集总大小为215748766字节,下载大小为32314400字节。数据文件根据不同的分割存储在相应的路径下。
该数据集包含多个特征,如来源、目标、当前页面、当前页面链接、下一页和索引级别0。数据集分为训练集、验证集和测试集,分别包含78088、26178和26193个样本。数据集总大小为215748766字节,下载大小为32314400字节。数据文件根据不同的分割存储在相应的路径下。
提供机构:
berquetR
原始信息汇总
数据集概述
数据集特征
- source: 数据类型为字符串
- target: 数据类型为字符串
- current_page: 数据类型为字符串
- current_page_links: 数据类型为字符串
- next_page: 数据类型为字符串
- index_level_0: 数据类型为整数(int64)
数据集分割
- 训练集(train): 包含78088个样本,总大小为128942469字节
- 验证集(validation): 包含26178个样本,总大小为43511265字节
- 测试集(test): 包含26193个样本,总大小为43295032字节
数据集大小
- 下载大小: 32314400字节
- 数据集总大小: 215748766字节
数据文件配置
- 配置名称: default
- 训练集路径: data/train-*
- 验证集路径: data/validation-*
- 测试集路径: data/test-*



