five

m-ric/english_historical_quotes

收藏
Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/m-ric/english_historical_quotes
下载链接
链接失效反馈
官方服务:
资源简介:
english_historical_quotes数据集是一个包含众多历史名言的集合,主要用于多标签文本分类和文本生成任务。每个名言内容均为英文,可以按作者和主题(使用标签)进行分类。数据集中的名言来自各种开放访问的互联网档案,并经过手动精炼,去除了重复和错误的名言。该数据集还支撑了一个网站,用于通过语义搜索查找历史名言。

english_historical_quotes数据集是一个包含众多历史名言的集合,主要用于多标签文本分类和文本生成任务。每个名言内容均为英文,可以按作者和主题(使用标签)进行分类。数据集中的名言来自各种开放访问的互联网档案,并经过手动精炼,去除了重复和错误的名言。该数据集还支撑了一个网站,用于通过语义搜索查找历史名言。
提供机构:
m-ric
原始信息汇总

数据集概述

数据集名称

Historical Quotes - English

数据集大小

10K<n<100K

数据集语言

  • 英语 (en)

数据集标签

  • 历史
  • 哲学
  • 艺术

支持的任务

  • 多标签文本分类
  • 文本生成
  • 填空任务

数据集结构

数据实例

json { "quote": "Almost anyone can be an author the business is to collect money and fame from this state of being.", "author": "A. A. Milne", "categories": "[business, money]" }

数据字段

  • author:引用作者
  • quote:引用文本
  • tags:引用相关的主题标签

数据分割

数据集作为一个整体,可通过Hugging Face datasets 库的 .train_test_split() 方法进一步处理。

数据集创建

来源数据

数据从多个开放访问的互联网档案中聚合,并经过手动精炼,去除了重复和错误引用。

许可证

MIT License

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作