ViDAS

Hugging Face2024-10-25 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/pranked03/ViDAS

下载链接

链接失效反馈

官方服务：

资源简介：

ViDAS数据集是一个新颖的数据集，旨在通过量化视频内容中的危险程度并评估大型语言模型（LLM）在危险评估中的表现，来推进危险分析和评估。数据集包含100个YouTube视频，每个视频由人类参与者标注危险等级（从0到10），并提供精确的时间戳以指示危险时刻。此外，LLM也被用于独立评估这些视频的危险水平，使用视频摘要进行评估。数据集还引入了均方误差（MSE）评分，用于多模态元评估人类和LLM危险评估之间的一致性。

创建时间：

2024-10-25

原始信息汇总

ViDAS Dataset

概述

ViDAS数据集旨在通过量化视频内容中的危险程度并评估大型语言模型（LLM）在危险评估中的表现，推动危险分析和评估的发展。该数据集包含100个YouTube视频，每个视频由人类参与者标注，提供了从0（无危险）到10（危及生命）的危险评级，并附有精确的时间戳，指示危险程度高的时刻。此外，利用LLM对这些视频进行独立评估，使用视频摘要来评估危险水平，并引入均方误差（MSE）分数进行多模态元评估，以衡量人类和LLM危险评估之间的一致性。

数据集信息

特征:
- youtube_id: 字符串
- title: 字符串
- description: 字符串
- url: 字符串
- channel_name: 字符串
- duration: 字符串
- video_id: 字符串
- video_summary: 字符串
- rating: 浮点数
- start_coord: 浮点数
- end_coord: 浮点数
分割:
- train: 100个样本，150791字节
下载大小: 95057字节
数据集大小: 150791字节
配置:
- default: 包含训练数据文件
任务类别:
- 视频分类
- 视觉问答
语言: 英语
标签:
- 危险评估
- 危险分类
- 风险评估
- 危害评估
- 行业
- 医疗保健
- 危险指标
规模类别: n<1K

使用方法

下载和使用数据集

python from datasets import load_dataset

dataset = load_dataset("pranked03/ViDAS")

下载视频并使用OpenCV加载

python i = 0 # 视频索引，范围为0到99

from huggingface_hub import hf_hub_download

file_path = hf_hub_download( repo_id="pranked03/ViDAS", filename=dataset["train"][i]["video_id"], repo_type="dataset" )

import cv2

cap = cv2.VideoCapture(file_path)

if not cap.isOpened(): print("Error: Could not open video.") exit()

while True: ret, frame = cap.read() if not ret: break

cv2.imshow(Video, frame)

if cv2.waitKey(25) & 0xFF == ord(q):
    break

cap.release() cv2.destroyAllWindows()

引用

@misc{gupta2024vidasvisionbaseddangerassessment, title={ViDAS: Vision-based Danger Assessment and Scoring}, author={Pranav Gupta and Advith Krishnan and Naman Nanda and Ananth Eswar and Deeksha Agarwal and Pratham Gohil and Pratyush Goel}, year={2024}, eprint={2410.00477}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2410.00477}, }

搜集汇总

数据集介绍

构建方式

ViDAS数据集的构建基于对YouTube视频内容的深度分析与标注。研究者们精选了100个涵盖多种事件的视频，并由人类参与者对每个视频的危险程度进行评分，评分范围从0（无危险）到10（危及生命）。同时，研究者还利用大型语言模型（LLM）对视频摘要进行独立评估，生成危险评分。通过引入均方误差（MSE）分数，数据集实现了对人类与LLM评估结果的多模态元评估，确保了数据的多样性与可靠性。

特点

ViDAS数据集的特点在于其专注于视频内容的危险评估，提供了详细的危险评分与时间戳信息，能够精确捕捉视频中的危险时刻。数据集不仅包含人类评估结果，还引入了LLM的独立评估，为危险评估提供了多视角分析。此外，数据集涵盖了工业、医疗等多个领域，具有广泛的应用价值。其结构化的元数据与视频文件相结合，为研究者提供了丰富的研究素材。

使用方法

使用ViDAS数据集时，研究者可以通过Hugging Face平台下载元数据，包括视频文件名、危险评分及时间坐标。视频文件可通过Hugging Face Hub下载，并利用OpenCV等库进行加载与处理。通过简单的代码示例，研究者可以轻松访问视频内容，并进行危险评估的相关分析。数据集的多模态特性使其适用于视频分类、视觉问答等多种任务，为危险评估研究提供了便捷的工具与资源。

背景与挑战

背景概述

ViDAS数据集由Pranav Gupta等研究人员于2024年推出，旨在推动视频内容中的危险分析与评估研究。该数据集包含100个YouTube视频，涵盖了多种事件场景，并通过人工参与者对每个视频的危险程度进行了标注，评分范围从0（无危险）到10（危及生命）。此外，数据集还引入了大语言模型（LLM）对视频摘要进行独立评估，以探索其在危险评估中的潜力。ViDAS不仅为视频危险评估提供了新的资源，还展示了LLM在实现类人评估方面的可能性，对计算机视觉和人工智能领域的研究具有重要影响。

当前挑战

ViDAS数据集在构建和应用过程中面临多重挑战。首先，视频内容的危险评估具有主观性，不同标注者可能对同一视频的危险程度存在分歧，这要求数据集在标注过程中需确保一致性和可靠性。其次，大语言模型在评估视频危险时，如何准确理解视频内容并生成与人类评估一致的评分，是一个技术难题。此外，数据集的规模相对较小，仅包含100个视频，可能限制了其在更广泛场景中的应用。如何在保证数据质量的同时扩展数据集规模，是未来研究需要解决的问题。

常用场景

经典使用场景

ViDAS数据集在视频危险评估领域具有重要应用，特别是在危险分类和风险评估任务中。该数据集通过收集100个YouTube视频，并由人类参与者进行危险评分，提供了精确的时间戳和危险等级标注。研究人员可以利用这些数据训练和验证视频分类模型，尤其是那些旨在识别和量化视频内容中危险程度的模型。此外，数据集还支持多模态元评估，通过比较人类与大型语言模型（LLM）的危险评估结果，探索LLM在危险评估中的潜力。

解决学术问题

ViDAS数据集解决了视频内容中危险量化评估的难题，为危险分类和风险评估提供了新的研究资源。通过引入人类标注的危险评分和LLM的独立评估，数据集为多模态元评估提供了基础，帮助研究人员探索LLM在危险评估中的表现。这不仅推动了视频危险评估领域的发展，还为LLM在类似任务中的应用提供了实证支持，具有重要的学术意义。

衍生相关工作

ViDAS数据集的发布催生了一系列相关研究，特别是在视频危险评估和LLM应用领域。基于该数据集，研究人员开发了多种危险分类模型，并探索了LLM在危险评估中的表现。此外，数据集还被用于多模态元评估研究，比较人类与LLM的评估结果，推动了LLM在危险评估任务中的应用。这些研究不仅丰富了视频危险评估的理论体系，还为相关技术的实际应用提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集