erhwenkuo/zhwikisource-zhtw

Name: erhwenkuo/zhwikisource-zhtw
Creator: erhwenkuo
Published: 2023-10-14 05:45:51
License: 暂无描述

Hugging Face2023-10-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/erhwenkuo/zhwikisource-zhtw

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是基于维基文库（Wikisource）的中文下载文件构建的，包含清理后的完整文章内容。每个示例包括文章的ID、URL、标题、语言标识（用于区分中文简体或繁体）和文本内容。数据集适用于文本生成任务，主要用于中文简体或繁体的文本处理。

提供机构：

erhwenkuo

原始信息汇总

数据集概述

示例: json { "id": "7183", "url": "https://zh.wikisource.org/wiki?curid=7183", "title": "相見歡 (李煜)", "lang": 1, "text": "無言獨上西樓，月如鉤。寂寞梧桐深院鎖清秋。剪不斷，理還亂，是離愁。別是一般滋味在心頭。" }

python from datasets import load_dataset

load_dataset("erhwenkuo/zhwikisource-zhtw", "20231001")

@ONLINE{wikidump, author = "Wikimedia Foundation", title = "Wikimedia Downloads", url = "https://dumps.wikimedia.org" }

5,000+

优质数据集

54 个

任务类型

进入经典数据集