m-ric/english_historical_quotes
收藏Hugging Face2023-11-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/m-ric/english_historical_quotes
下载链接
链接失效反馈官方服务:
资源简介:
english_historical_quotes数据集是一个包含众多历史名言的集合,主要用于多标签文本分类和文本生成任务。每个名言内容均为英文,可以按作者和主题(使用标签)进行分类。数据集中的名言来自各种开放访问的互联网档案,并经过手动精炼,去除了重复和错误的名言。该数据集还支撑了一个网站,用于通过语义搜索查找历史名言。
english_historical_quotes数据集是一个包含众多历史名言的集合,主要用于多标签文本分类和文本生成任务。每个名言内容均为英文,可以按作者和主题(使用标签)进行分类。数据集中的名言来自各种开放访问的互联网档案,并经过手动精炼,去除了重复和错误的名言。该数据集还支撑了一个网站,用于通过语义搜索查找历史名言。
提供机构:
m-ric
原始信息汇总
数据集概述
数据集名称
Historical Quotes - English
数据集大小
10K<n<100K
数据集语言
- 英语 (en)
数据集标签
- 历史
- 哲学
- 艺术
支持的任务
- 多标签文本分类
- 文本生成
- 填空任务
数据集结构
数据实例
json { "quote": "Almost anyone can be an author the business is to collect money and fame from this state of being.", "author": "A. A. Milne", "categories": "[business, money]" }
数据字段
author:引用作者quote:引用文本tags:引用相关的主题标签
数据分割
数据集作为一个整体,可通过Hugging Face datasets 库的 .train_test_split() 方法进一步处理。
数据集创建
来源数据
数据从多个开放访问的互联网档案中聚合,并经过手动精炼,去除了重复和错误引用。
许可证
MIT License



