five

caretech-owl/wikiquote-de-quotes

收藏
Hugging Face2023-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/caretech-owl/wikiquote-de-quotes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自[wikiquote](https://de.wikiquote.org/wiki/Hauptseite)的德语引用。数据集由两列组成,分别命名为author和quote。为了重新生成数据集,提供了源代码。数据来源于2021年11月27日的https://dumps.wikimedia.org/dewikiquote/,并遵循CC BY-SA 4.0许可证。
提供机构:
caretech-owl
原始信息汇总

数据集卡片:Wikiquotes German

概述

  • 数据集名称: Wikiquotes German
  • 数据来源: wikiquote
  • 语言: 德语
  • 数据结构: 包含两列,分别为 author 和 quote

使用方法

  • 数据集生成: 提供了源代码用于重新生成数据集,使用方法如下: sh pip install bs4 pandas python CrawlingQuotes.py

  • Python 使用: 安装 🤗 datasets 后,可以使用以下代码加载数据集: python from datasets import load_dataset training_data = load_dataset("caretech-owl/wikiquote-de-quotes", split="train")

版权信息

  • 数据来源: 原始数据从 https://dumps.wikimedia.org/dewikiquote/ 获取,日期为 November 27th。
  • 许可协议: CC BY-SA 4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作