webis/args_me
收藏Hugging Face2022-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/webis/args_me
下载链接
链接失效反馈官方服务:
资源简介:
args.me语料库(版本1.0,清理后)包含从四个辩论门户网站(Debatewise、IDebate.org、Debatepedia和Debate.org)在2019年中期爬取的382,545个论点。这些论点使用针对每个辩论门户设计的启发式方法提取。数据集主要用于文档检索和争议性问题的论点检索任务,且仅包含英语文档。
The args.me Corpus (Version 1.0, cleaned) contains 382,545 arguments crawled from four debate portals (Debatewise, IDebate.org, Debatepedia, and Debate.org) in mid-2019. These arguments were extracted using heuristic methods tailored for each of these debate portals. This dataset is primarily intended for document retrieval and argument retrieval tasks for controversial issues, and only contains English-language documents.
提供机构:
webis
原始信息汇总
数据集概述
数据集名称
- 名称: Webis args.me argument corpus
- 版本: 1.0, cleaned
数据集特征
- 语言: 英语(主要为en-US)
- 许可证: Creative Commons Attribution 4.0 International (CC BY 4.0)
- 多语言性: 单语种
- 大小: 100K<n<1M
数据集内容
- 来源: 原创数据,从四个辩论门户网站(Debatewise, IDebate.org, Debatepedia, Debate.org)爬取
- 数量: 包含382,545个辩论论点
- 数据实例: 每个实例包含结论、ID、论点和立场
数据集使用
- 用途: 用于文档检索和争议问题辩论检索
- 示例代码: 使用
datasets库加载数据集,并迭代打印结论、ID、论点和立场
数据集结构
- 数据实例示例: 包含结论、ID、论点和立场字段
数据集创建
- 许可证信息: 遵循Creative Commons Attribution 4.0 International (CC BY 4.0)
- 引用信息: 提供详细的引用格式和DOI
数据集使用注意事项
- 数据集限制: 需要进一步信息以评估
- 社会影响和偏见讨论: 需要进一步信息以评估
搜集汇总
数据集介绍

背景与挑战
背景概述
args.me语料库(版本1.0,清理后)包含从四个辩论门户网站爬取的382,545个论点,主要用于文档检索和争议问题论点检索任务。该数据集仅包含英语内容,采用CC BY 4.0许可证发布,规模在10万到100万之间。
以上内容由遇见数据集搜集并总结生成



