five

NicholasSynovic/Modified-VEAA

收藏
Hugging Face2023-05-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NicholasSynovic/Modified-VEAA
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Victorian Era Authorship Attribution Dataset的修改版本。主要修改包括将训练数据集分为80%的训练数据和20%的测试数据,并采用随机分层抽样方法。此外,所有文本已转换为UTF-8格式,并忽略了任何错误。原始测试数据未包含在此版本中。
提供机构:
NicholasSynovic
原始信息汇总

Modified Victorian Era Authorship Attribution Dataset

数据集概述

基本信息

  • 许可协议:AGPL-3.0
  • 任务类别:文本分类
  • 语言:英语
  • 数据集大小:10,000 < n < 100,000

数据集描述

  • 此数据集是对原始数据集的修改版本,原始数据集可在此链接找到:https://archive.ics.uci.edu/ml/datasets/Victorian+Era+Authorship+Attribution
  • 修改内容包括:
    • 将训练数据集分为80%的训练集和20%的测试集,均带有标签。
    • 使用随机分层抽样方法进行数据分割。
    • 所有文本已转换为UTF-8格式,忽略任何错误。
    • 原始测试数据未包含在此版本中。

引用信息

  • GUNGOR, ABDULMECIT, Benchmarking Authorship Attribution Techniques Using Over A Thousand Books by Fifty Victorian Era Novelists, Purdue Master of Thesis, 2018-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作