jmLuis/MediaFrameCorpus-PhilippineFrameCorpus-Combined
收藏Hugging Face2023-11-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jmLuis/MediaFrameCorpus-PhilippineFrameCorpus-Combined
下载链接
链接失效反馈官方服务:
资源简介:
---
task_categories:
- text-classification
language:
- en
pretty_name: MFC+PFC
size_categories:
- 10K<n<100K
---
This training and validation dataset is a combination of Media Frame Corpus and Philippine Frame Corpus, labeled using the Policy Issue Frames Codebook. Train-test split of 80-20.
Code_frames column contains annotations following the PolicyIssue Frames Codebook (1-15), wherein at least two(2) annotators agree with the label.
The text column contains sentences/phrases from online news articles.
The label column is the 0th index code_frames used for training.
提供机构:
jmLuis
原始信息汇总
数据集概述
任务类别
- 文本分类
语言
- 英语
数据集名称
- MFC+PFC
数据集大小
- 10K<n<100K
数据集描述
- 该训练和验证数据集是媒体框架语料库(Media Frame Corpus)和菲律宾框架语料库(Philippine Frame Corpus)的组合,使用政策问题框架编码本(Policy Issue Frames Codebook)进行标注。训练集和测试集的比例为80-20。
数据集结构
- code_frames 列:包含遵循政策问题框架编码本(1-15)的标注,至少有两个标注者同意该标签。
- text 列:包含来自在线新闻文章的句子/短语。
- label 列:用于训练的第0个索引的code_frames。



