nlplabtdtu/tvpl-qa-detail-v2
收藏Hugging Face2024-05-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nlplabtdtu/tvpl-qa-detail-v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如发布日期、标题、问题、内容、参考文献、领域、URL和爬取日期。数据集仅包含一个训练集分割,训练集的大小为262746330字节,包含46402个样本。数据集的下载大小为79834503字节,总大小为262746330字节。
数据集信息:
特征字段:
- 发布日期(published_date):数据类型为字符串
- 标题(title):数据类型为字符串
- 问题(question):数据类型为字符串
- 内容(content):数据类型为字符串
- 引用(refs):字符串序列类型
- 领域(domain):数据类型为字符串
- 统一资源定位符(URL):数据类型为字符串
- 爬取日期(crawled_date):数据类型为秒级时间戳(timestamp[s])
数据集划分:
- 训练集(train):占用字节数为262746330,共包含46402条数据样本
下载总大小为79834503字节,数据集总存储大小为262746330字节
数据集配置:
- 默认配置(default):对应训练集划分的数据文件路径为data/train-*
提供机构:
nlplabtdtu
原始信息汇总
数据集概述
数据集特征
- published_date: 数据类型 - 字符串
- title: 数据类型 - 字符串
- question: 数据类型 - 字符串
- content: 数据类型 - 字符串
- refs: 数据类型 - 字符串序列
- domain: 数据类型 - 字符串
- url: 数据类型 - 字符串
- crawled_date: 数据类型 - 时间戳(秒)
数据集划分
- train:
- 字节数: 262746330
- 示例数: 46402
数据集大小
- 下载大小: 79834503
- 数据集大小: 262746330
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: train
- data_files:



