TopicNet/Brown

Name: TopicNet/Brown
Creator: TopicNet
Published: 2024-07-13 10:53:28
License: 暂无描述

Hugging Face2024-07-13 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/TopicNet/Brown

下载链接

链接失效反馈

官方服务：

资源简介：

Brown Corpus是1961年在布朗大学创建的第一个百万词的英语电子语料库。该语料库包含来自500个不同来源的文本，这些来源按类型分类，如新闻、社论等。数据集包含15个主题，500篇文章，用于主题分类、多类分类和多标签分类等多种文本分类任务。

提供机构：

TopicNet

原始信息汇总

数据集概述

语言: 英语
多语言性: 单语种
许可证: topicnet
许可证链接: https://github.com/machine-intelligence-laboratory/TopicNet/blob/master/LICENSE.txt

配置名称: bag-of-words
- 默认: 是
- 数据文件:
  - 分割: 训练
  - 路径: "data/Brown_BOW.csv.gz"
配置名称: natural-order-of-words
- 数据文件:
  - 分割: 训练
  - 路径: "data/Brown_NOOW.csv.gz"

5,000+

优质数据集

54 个

任务类型

进入经典数据集