five

jasong03/vov_phapluat

收藏
Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/jasong03/vov_phapluat
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含以下特征:标题(字符串类型)、摘要(字符串类型)、内容(字符串类型)、URL(字符串类型)和元数据(包含发布日期、抓取日期和标签的结构体)。数据集分为训练集,训练集包含71341个示例,总字节数为325114403。数据集的下载大小为125167539字节,实际大小为325114403字节。

The dataset includes features such as title (string type), summary (string type), content (string type), URL (string type), and metadata (a struct containing published date, crawled date, and tags). The dataset is split into a training set, which contains 71341 examples with a total byte size of 325114403. The download size of the dataset is 125167539 bytes, and the actual size is 325114403 bytes.
提供机构:
jasong03
原始信息汇总

数据集概述

数据集信息

特征

  • title: 数据类型为 string
  • summary: 数据类型为 string
  • content: 数据类型为 string
  • url: 数据类型为 string
  • metadata: 结构化数据,包含以下字段:
    • published_date: 数据类型为 timestamp[s]
    • crawled_date: 数据类型为 timestamp[s]
    • tags: 数据类型为 sequence,元素类型为 string

数据分割

  • train: 包含 71341 个样本,总大小为 325114403 字节。

数据集大小

  • 下载大小: 125167539 字节。
  • 数据集大小: 325114403 字节。

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作