webis/args_me

Name: webis/args_me
Creator: webis
Published: 2022-09-21 12:09:09
License: 暂无描述

Hugging Face2022-09-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/webis/args_me

下载链接

链接失效反馈

官方服务：

资源简介：

args.me语料库（版本1.0，清理后）包含从四个辩论门户网站（Debatewise、IDebate.org、Debatepedia和Debate.org）在2019年中期爬取的382,545个论点。这些论点使用针对每个辩论门户设计的启发式方法提取。数据集主要用于文档检索和争议性问题的论点检索任务，且仅包含英语文档。

The args.me Corpus (Version 1.0, cleaned) contains 382,545 arguments crawled from four debate portals (Debatewise, IDebate.org, Debatepedia, and Debate.org) in mid-2019. These arguments were extracted using heuristic methods tailored for each of these debate portals. This dataset is primarily intended for document retrieval and argument retrieval tasks for controversial issues, and only contains English-language documents.

提供机构：

webis

原始信息汇总

数据集概述

数据集名称

名称: Webis args.me argument corpus
版本: 1.0, cleaned

数据集特征

语言: 英语（主要为en-US）
许可证: Creative Commons Attribution 4.0 International (CC BY 4.0)
多语言性: 单语种
大小: 100K<n<1M

数据集内容

来源: 原创数据，从四个辩论门户网站（Debatewise, IDebate.org, Debatepedia, Debate.org）爬取
数量: 包含382,545个辩论论点
数据实例: 每个实例包含结论、ID、论点和立场

数据集使用

用途: 用于文档检索和争议问题辩论检索
示例代码: 使用datasets库加载数据集，并迭代打印结论、ID、论点和立场

数据集结构

数据实例示例: 包含结论、ID、论点和立场字段

数据集创建

许可证信息: 遵循Creative Commons Attribution 4.0 International (CC BY 4.0)
引用信息: 提供详细的引用格式和DOI

数据集使用注意事项

数据集限制: 需要进一步信息以评估
社会影响和偏见讨论: 需要进一步信息以评估

搜集汇总

数据集介绍

背景与挑战

背景概述

args.me语料库（版本1.0，清理后）包含从四个辩论门户网站爬取的382,545个论点，主要用于文档检索和争议问题论点检索任务。该数据集仅包含英语内容，采用CC BY 4.0许可证发布，规模在10万到100万之间。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集