zetavg/zh-tw-wikipedia-dev
收藏Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zetavg/zh-tw-wikipedia-dev
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: pageid
dtype: int64
- name: html
dtype: string
- name: markdown
dtype: string
- name: coordinate
struct:
- name: globe
dtype: string
- name: lat
dtype: float64
- name: lon
dtype: float64
- name: length
dtype: int64
- name: touched
dtype: string
- name: lastrevid
dtype: int64
- name: original_title
dtype: string
splits:
- name: train
num_bytes: 8657481.515956817
num_examples: 1000
download_size: 5008132
dataset_size: 8657481.515956817
---
A small subset of [`zetavg/zh-tw-wikipedia`](https://huggingface.co/datasets/zetavg/zh-tw-wikipedia) that contains only 1,000 randomly picked rows. For development usage.
提供机构:
zetavg
原始信息汇总
数据集概述
数据集特征
- pageid: 整数类型 (int64)
- html: 字符串类型 (string)
- markdown: 字符串类型 (string)
- coordinate: 结构体类型,包含以下字段:
- globe: 字符串类型 (string)
- lat: 浮点数类型 (float64)
- lon: 浮点数类型 (float64)
- length: 整数类型 (int64)
- touched: 字符串类型 (string)
- lastrevid: 整数类型 (int64)
- original_title: 字符串类型 (string)
数据集分割
- train:
- 数据量: 8657481.515956817 字节
- 示例数量: 1000
数据集大小
- 下载大小: 5008132 字节
- 数据集大小: 8657481.515956817 字节



