james-burton/news_channel_all_text
收藏Hugging Face2023-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/james-burton/news_channel_all_text
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ' n_tokens_content'
dtype: string
- name: ' n_unique_tokens'
dtype: string
- name: ' n_non_stop_words'
dtype: string
- name: ' n_non_stop_unique_tokens'
dtype: string
- name: ' num_hrefs'
dtype: string
- name: ' num_self_hrefs'
dtype: string
- name: ' num_imgs'
dtype: string
- name: ' num_videos'
dtype: string
- name: ' average_token_length'
dtype: string
- name: ' num_keywords'
dtype: string
- name: ' global_subjectivity'
dtype: string
- name: ' global_sentiment_polarity'
dtype: string
- name: ' global_rate_positive_words'
dtype: string
- name: ' global_rate_negative_words'
dtype: string
- name: ' rate_positive_words'
dtype: string
- name: ' rate_negative_words'
dtype: string
- name: article_title
dtype: string
- name: channel
dtype: int64
splits:
- name: train
num_bytes: 4893096
num_examples: 17241
- name: validation
num_bytes: 863581
num_examples: 3043
- name: test
num_bytes: 1439606
num_examples: 5071
download_size: 3921037
dataset_size: 7196283
---
# Dataset Card for "news_channel_all_text"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
james-burton
原始信息汇总
数据集概述
特征信息
- n_tokens_content: 字符串类型
- n_unique_tokens: 字符串类型
- n_non_stop_words: 字符串类型
- n_non_stop_unique_tokens: 字符串类型
- num_hrefs: 字符串类型
- num_self_hrefs: 字符串类型
- num_imgs: 字符串类型
- num_videos: 字符串类型
- average_token_length: 字符串类型
- num_keywords: 字符串类型
- global_subjectivity: 字符串类型
- global_sentiment_polarity: 字符串类型
- global_rate_positive_words: 字符串类型
- global_rate_negative_words: 字符串类型
- rate_positive_words: 字符串类型
- rate_negative_words: 字符串类型
- article_title: 字符串类型
- channel: 整数类型
数据分割
- train:
- 字节数: 4893096
- 样本数: 17241
- validation:
- 字节数: 863581
- 样本数: 3043
- test:
- 字节数: 1439606
- 样本数: 5071
数据集大小
- 下载大小: 3921037 字节
- 数据集大小: 7196283 字节



