NicholasSynovic/Modified-VEAA
收藏Hugging Face2023-05-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NicholasSynovic/Modified-VEAA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Victorian Era Authorship Attribution Dataset的修改版本。主要修改包括将训练数据集分为80%的训练数据和20%的测试数据,并采用随机分层抽样方法。此外,所有文本已转换为UTF-8格式,并忽略了任何错误。原始测试数据未包含在此版本中。
提供机构:
NicholasSynovic
原始信息汇总
Modified Victorian Era Authorship Attribution Dataset
数据集概述
基本信息
- 许可协议:AGPL-3.0
- 任务类别:文本分类
- 语言:英语
- 数据集大小:10,000 < n < 100,000
数据集描述
- 此数据集是对原始数据集的修改版本,原始数据集可在此链接找到:https://archive.ics.uci.edu/ml/datasets/Victorian+Era+Authorship+Attribution。
- 修改内容包括:
- 将训练数据集分为80%的训练集和20%的测试集,均带有标签。
- 使用随机分层抽样方法进行数据分割。
- 所有文本已转换为UTF-8格式,忽略任何错误。
- 原始测试数据未包含在此版本中。
引用信息
- GUNGOR, ABDULMECIT, Benchmarking Authorship Attribution Techniques Using Over A Thousand Books by Fifty Victorian Era Novelists, Purdue Master of Thesis, 2018-04



