five

arbml/AraFacts

收藏
hugging_face2022-10-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arbml/AraFacts
下载链接
链接失效反馈
资源简介:
--- dataset_info: features: - name: ClaimID dtype: string - name: claim dtype: string - name: description dtype: string - name: source dtype: string - name: date dtype: string - name: source_label dtype: string - name: normalized_label dtype: string - name: source_category dtype: string - name: normalized_category dtype: string - name: source_url dtype: string - name: claim_urls dtype: string - name: evidence_urls dtype: string - name: claim_type dtype: string splits: - name: train num_bytes: 13201528 num_examples: 6222 download_size: 5719822 dataset_size: 13201528 --- # Dataset Card for "AraFacts" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
arbml
原始信息汇总

数据集概述

数据集名称

AraFacts

数据集特征

  • ClaimID: 数据类型 - 字符串
  • claim: 数据类型 - 字符串
  • description: 数据类型 - 字符串
  • source: 数据类型 - 字符串
  • date: 数据类型 - 字符串
  • source_label: 数据类型 - 字符串
  • normalized_label: 数据类型 - 字符串
  • source_category: 数据类型 - 字符串
  • normalized_category: 数据类型 - 字符串
  • source_url: 数据类型 - 字符串
  • claim_urls: 数据类型 - 字符串
  • evidence_urls: 数据类型 - 字符串
  • claim_type: 数据类型 - 字符串

数据集分割

  • train:
    • 数据量: 13201528 字节
    • 示例数量: 6222

数据集大小

  • 下载大小: 5719822 字节
  • 数据集总大小: 13201528 字节
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

yahoo-finance-data

该数据集包含从Yahoo! Finance、Nasdaq和U.S. Department of the Treasury获取的财务数据,旨在用于研究和教育目的。数据集包括公司详细信息、高管信息、财务指标、历史盈利、股票价格、股息事件、股票拆分、汇率和每日国债收益率等。每个数据集都有其来源、简要描述以及列出的列及其数据类型和描述。数据定期更新,并以Parquet格式提供,可通过DuckDB进行查询。

huggingface 收录

RFUAV

RFUAV数据集是由浙江科技大学信息科学与工程学院开发的高质量原始射频数据集,包含37种不同无人机的约1.3 TB原始频率数据。该数据集旨在解决现有无人机检测数据集类型单一、数据量不足、信号-to-噪声比(SNR)范围有限等问题,提供了丰富的SNR级别和用于特征提取的基准预处理方法及模型评估工具。数据集适用于射频无人机检测和识别,有助于推动相关技术的研究与应用。

arXiv 收录