five

mstz/victorian_authorship

收藏
Hugging Face2023-10-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mstz/victorian_authorship
下载链接
链接失效反馈
官方服务:
资源简介:
维多利亚时代作者数据集用于确定给定文本是由哪位维多利亚时代的作者所写。该数据集包含超过一千本书,由五十位维多利亚时代的小说家所著,适用于文本分类任务。
提供机构:
mstz
原始信息汇总

维多利亚时代作者数据集

概述

  • 语言: 英语
  • 标签: 维多利亚时代, 文本分类
  • 名称: 维多利亚时代作者
  • 大小: 10K<n<100K
  • 任务类别: 文本分类
  • 许可证: cc

任务描述

  • 配置: 作者身份
  • 任务: 分类
  • 描述: 确定给定文本的维多利亚时代作者

使用方法

python from datasets import load_dataset

dataset = load_dataset("mstz/victorian_authorship", "authorship")["train"]

特征

特征 类型
text [string]

引用

@phdthesis{gungor2018benchmarking, title={Benchmarking authorship attribution techniques using over a thousand books by fifty victorian era novelists}, author={Gungor, Abdulmecit}, year={2018}, school={Purdue University} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作