five

webis/args_me

收藏
Hugging Face2022-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/webis/args_me
下载链接
链接失效反馈
官方服务:
资源简介:
args.me语料库(版本1.0,清理后)包含从四个辩论门户网站(Debatewise、IDebate.org、Debatepedia和Debate.org)在2019年中期爬取的382,545个论点。这些论点使用针对每个辩论门户设计的启发式方法提取。数据集主要用于文档检索和争议性问题的论点检索任务,且仅包含英语文档。

The args.me Corpus (Version 1.0, cleaned) contains 382,545 arguments crawled from four debate portals (Debatewise, IDebate.org, Debatepedia, and Debate.org) in mid-2019. These arguments were extracted using heuristic methods tailored for each of these debate portals. This dataset is primarily intended for document retrieval and argument retrieval tasks for controversial issues, and only contains English-language documents.
提供机构:
webis
原始信息汇总

数据集概述

数据集名称

  • 名称: Webis args.me argument corpus
  • 版本: 1.0, cleaned

数据集特征

  • 语言: 英语(主要为en-US)
  • 许可证: Creative Commons Attribution 4.0 International (CC BY 4.0)
  • 多语言性: 单语种
  • 大小: 100K<n<1M

数据集内容

  • 来源: 原创数据,从四个辩论门户网站(Debatewise, IDebate.org, Debatepedia, Debate.org)爬取
  • 数量: 包含382,545个辩论论点
  • 数据实例: 每个实例包含结论、ID、论点和立场

数据集使用

  • 用途: 用于文档检索和争议问题辩论检索
  • 示例代码: 使用datasets库加载数据集,并迭代打印结论、ID、论点和立场

数据集结构

  • 数据实例示例: 包含结论、ID、论点和立场字段

数据集创建

  • 许可证信息: 遵循Creative Commons Attribution 4.0 International (CC BY 4.0)
  • 引用信息: 提供详细的引用格式和DOI

数据集使用注意事项

  • 数据集限制: 需要进一步信息以评估
  • 社会影响和偏见讨论: 需要进一步信息以评估
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
args.me语料库(版本1.0,清理后)包含从四个辩论门户网站爬取的382,545个论点,主要用于文档检索和争议问题论点检索任务。该数据集仅包含英语内容,采用CC BY 4.0许可证发布,规模在10万到100万之间。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作