Politiquices
收藏github2024-05-15 更新2024-05-31 收录
下载链接:
https://github.com/RiverBench/dataset-politiquices
下载链接
链接失效反馈官方服务:
资源简介:
从Arquivo.pt存档的新闻文章中提取的支持和反对关系,描述了葡萄牙语新闻文章及其呈现的政治立场。
Supportive and opposing relationships extracted from news articles archived by Arquivo.pt, describing Portuguese news articles and their presented political stances.
创建时间:
2023-05-01
原始信息汇总
数据集概述
基本信息
- 标题: Politiquices (英语)
- 标识符:
politiquices - 版本:
dev - 主题:
- 政治沟通 (eurovoc:c_9eea2203)
- 政治新闻 (eurovoc:2600)
- 政治学 (eurovoc:4704)
- 创建者:
- David Soares Batista
- Piotr Sowiński (昵称: Ostrzyciel)
- 许可证: CC-BY-4.0
- 来源:
- 发布日期: 2023-05-01
- 最后修改日期: 2024-06-05
- 着陆页: politiquices (dev)
技术元数据
- 流类型使用:
- RDF图流 (评论: 数据集可以被视为对应于新闻文章的图流)
- 扁平RDF三元流 (评论: 数据集可以被视为扁平的三元流)
- 流元素计数: 17,773
- 流元素分割类型: 按主题分割 (评论: 每个流元素对应一篇新闻文章)
- 使用词汇:
- 符合W3C RDF 1.1规范: 是
- 符合W3C RDF-star草案规范: 是
- 使用广义三元组: 否
- 使用广义RDF数据集: 否
- 使用RDF-star: 否
分布
完整流分布
- 标题: 完整流分布
- 标识符:
stream-full - 文件名:
stream_full.tar.gz - 流类型使用: RDF图流
- 分布类型: 完整分布, 流分布
- 流元素计数: 17,773
- 字节大小: 2.46 MB
- 媒体类型: text/turtle
- 打包格式: application/tar
- 压缩格式: application/gzip
- 下载URL: https://w3id.org/riverbench/datasets/politiquices/dev/files/stream_full.tar.gz
完整Jelly分布
- 标题: 完整Jelly分布
- 标识符:
jelly-full - 文件名:
jelly_full.jelly.gz - 流类型使用: 扁平RDF三元流, RDF图流
- 分布类型: 完整分布, Jelly分布
- 流元素计数: 17,773
- 字节大小: 2.47 MB
- 媒体类型: application/x-jelly-rdf
- 压缩格式: application/gzip
- 下载URL: https://w3id.org/riverbench/datasets/politiquices/dev/files/jelly_full.jelly.gz
完整扁平分布
- 标题: 完整扁平分布
- 标识符:
flat-full - 文件名:
flat_full.nt.gz - 流类型使用: 扁平RDF三元流
- 分布类型: 完整分布
- 流元素计数: 17,773
- 字节大小: 2.47 MB
- 媒体类型: application/x-jelly-rdf
- 压缩格式: application/gzip
- 下载URL: https://w3id.org/riverbench/datasets/politiquices/dev/files/jelly_full.jelly.gz
搜集汇总
数据集介绍

构建方式
Politiquices数据集通过从Arquivo.pt存档的新闻文章中提取支持与反对关系构建而成。该数据集以葡萄牙语描述新闻文章,并呈现其政治立场。构建过程中,数据集从欧洲数据门户获取源数据,并通过特定的处理流程将新闻文章与政治立场关联,形成结构化的支持与反对关系数据。
特点
Politiquices数据集的主要特点在于其专注于政治沟通领域,涵盖了政治新闻和政治话题。数据集以RDF格式呈现,支持两种流类型:RDF图流和平面RDF三元组流。此外,数据集的元素按主题划分,每个元素对应一篇新闻文章,便于按主题进行分析和处理。
使用方法
Politiquices数据集可通过多种方式使用,包括作为RDF图流或平面RDF三元组流进行处理。用户可以选择下载完整数据集或部分数据集(如10K元素的子集),并根据需求选择不同的压缩格式(如Jelly或NTriples)。数据集的RDF格式确保了其在语义网技术中的广泛适用性,适用于各种基于RDF的分析和应用。
背景与挑战
背景概述
Politiquices数据集是由David Soares Batista和Piotr Sowiński创建的,旨在分析葡萄牙语新闻文章中的支持和反对关系。该数据集的核心研究问题集中在政治立场的识别与分析,通过对新闻文章的语义解析,揭示不同政治立场的表达。该数据集的创建时间为2023年5月,其主要来源为Arquivo.pt存档的新闻文章,并由欧洲数据门户提供支持。Politiquices数据集的发布不仅为政治传播、政治新闻和政治学研究提供了宝贵的资源,还为相关领域的学者和研究人员提供了新的研究视角。
当前挑战
Politiquices数据集在构建过程中面临多项挑战。首先,从新闻文章中提取政治立场信息需要复杂的自然语言处理技术,尤其是对葡萄牙语的语义解析。其次,新闻文章的多样性和复杂性增加了数据处理的难度,如何确保数据的准确性和一致性是一个重要问题。此外,数据集的规模和结构化处理也带来了技术上的挑战,特别是在处理大规模RDF数据流时,如何高效地存储和检索数据是一个关键问题。最后,政治立场的多样性和主观性使得标注和分类过程复杂,确保标注的客观性和准确性是该数据集面临的另一大挑战。
常用场景
经典使用场景
Politiquices数据集的经典使用场景主要集中在政治传播和新闻分析领域。该数据集通过提取新闻文章中的支持和反对关系,帮助研究者分析特定政治事件或议题的舆论倾向。例如,研究者可以利用该数据集识别特定新闻文章中的政治立场,进而分析不同媒体对同一事件的报道差异,或评估公众舆论对某一政策的反应。
实际应用
Politiquices数据集在实际应用中具有广泛的潜力。首先,它可以用于媒体监测和舆论分析,帮助政府、非政府组织和媒体机构了解公众对特定政治事件或政策的反应。其次,该数据集可用于政治竞选策略的制定,通过分析不同媒体的报道倾向,帮助候选人或政党调整其宣传策略。此外,学术界和智库也可以利用该数据集进行深入的政治传播研究,为政策制定提供数据支持。
衍生相关工作
基于Politiquices数据集,已衍生出多项相关研究工作。例如,有学者利用该数据集开发了自动化的政治立场识别模型,进一步提升了新闻分析的效率和准确性。此外,该数据集还被用于构建跨文化政治传播的比较框架,帮助研究者在全球范围内分析不同政治体系的舆论动态。还有一些研究聚焦于媒体偏见和信息操纵,通过分析Politiquices数据集中的支持与反对关系,揭示媒体在塑造公众舆论中的潜在影响。
以上内容由遇见数据集搜集并总结生成



