five

Brown Corpus(Brown Corpus 布朗语料库)

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88742
下载链接
链接失效反馈
官方服务:
资源简介:
布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸文本、书籍以及政府文件,包含 1,014,312 个单词的它主要用于语言建模。

The Brown Corpus is the first text corpus of American English. It is compiled from newspaper texts, books, and government documents across diverse topics, and it contains 1,014,312 words, which is primarily utilized for language modeling.
提供机构:
阿里云天池
创建时间:
2021-01-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Brown Corpus(布朗语料库)是美国英语的首个文本语料库,包含来自不同主题的1,014,312个单词,主要用于语言建模。原始数据包含手动注释的句子和标记边界,转换后的版本基于TEI/XML重建。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务