arbml/AraFacts

hugging_face2022-10-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/arbml/AraFacts

下载链接

链接失效反馈

资源简介：

--- dataset_info: features: - name: ClaimID dtype: string - name: claim dtype: string - name: description dtype: string - name: source dtype: string - name: date dtype: string - name: source_label dtype: string - name: normalized_label dtype: string - name: source_category dtype: string - name: normalized_category dtype: string - name: source_url dtype: string - name: claim_urls dtype: string - name: evidence_urls dtype: string - name: claim_type dtype: string splits: - name: train num_bytes: 13201528 num_examples: 6222 download_size: 5719822 dataset_size: 13201528 --- # Dataset Card for "AraFacts" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

arbml

原始信息汇总

数据集概述

数据集名称

AraFacts

数据集特征

ClaimID: 数据类型 - 字符串
claim: 数据类型 - 字符串
description: 数据类型 - 字符串
source: 数据类型 - 字符串
date: 数据类型 - 字符串
source_label: 数据类型 - 字符串
normalized_label: 数据类型 - 字符串
source_category: 数据类型 - 字符串
normalized_category: 数据类型 - 字符串
source_url: 数据类型 - 字符串
claim_urls: 数据类型 - 字符串
evidence_urls: 数据类型 - 字符串
claim_type: 数据类型 - 字符串

数据集分割

train:
- 数据量: 13201528 字节
- 示例数量: 6222

数据集大小

下载大小: 5719822 字节
数据集总大小: 13201528 字节

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据，包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情，支持职业规划和薪资谈判。

www.linkedin.com 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度，中国近海台风路径数据集，包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据，经过处理整合后形成文件，如使用csv文件需使用文本编辑器打开浏览，否则会出现乱码，如要使用excel查看数据，请使用xlsx的格式。

国家海洋科学数据中心收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据，收集自多个方言区域的本地方言使用者，涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件，单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别（ASR）和音频说话人识别。

hugging_face 收录

yahoo-finance-data

该数据集包含从Yahoo! Finance、Nasdaq和U.S. Department of the Treasury获取的财务数据，旨在用于研究和教育目的。数据集包括公司详细信息、高管信息、财务指标、历史盈利、股票价格、股息事件、股票拆分、汇率和每日国债收益率等。每个数据集都有其来源、简要描述以及列出的列及其数据类型和描述。数据定期更新，并以Parquet格式提供，可通过DuckDB进行查询。

huggingface 收录

RFUAV

RFUAV数据集是由浙江科技大学信息科学与工程学院开发的高质量原始射频数据集，包含37种不同无人机的约1.3 TB原始频率数据。该数据集旨在解决现有无人机检测数据集类型单一、数据量不足、信号-to-噪声比(SNR)范围有限等问题，提供了丰富的SNR级别和用于特征提取的基准预处理方法及模型评估工具。数据集适用于射频无人机检测和识别，有助于推动相关技术的研究与应用。

arXiv 收录