five

ViDAS

收藏
Hugging Face2024-10-25 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/pranked03/ViDAS
下载链接
链接失效反馈
官方服务:
资源简介:
ViDAS数据集是一个新颖的数据集,旨在通过量化视频内容中的危险程度并评估大型语言模型(LLM)在危险评估中的表现,来推进危险分析和评估。数据集包含100个YouTube视频,每个视频由人类参与者标注危险等级(从0到10),并提供精确的时间戳以指示危险时刻。此外,LLM也被用于独立评估这些视频的危险水平,使用视频摘要进行评估。数据集还引入了均方误差(MSE)评分,用于多模态元评估人类和LLM危险评估之间的一致性。
创建时间:
2024-10-25
原始信息汇总

ViDAS Dataset

概述

ViDAS数据集旨在通过量化视频内容中的危险程度并评估大型语言模型(LLM)在危险评估中的表现,推动危险分析和评估的发展。该数据集包含100个YouTube视频,每个视频由人类参与者标注,提供了从0(无危险)到10(危及生命)的危险评级,并附有精确的时间戳,指示危险程度高的时刻。此外,利用LLM对这些视频进行独立评估,使用视频摘要来评估危险水平,并引入均方误差(MSE)分数进行多模态元评估,以衡量人类和LLM危险评估之间的一致性。

数据集信息

  • 特征:
    • youtube_id: 字符串
    • title: 字符串
    • description: 字符串
    • url: 字符串
    • channel_name: 字符串
    • duration: 字符串
    • video_id: 字符串
    • video_summary: 字符串
    • rating: 浮点数
    • start_coord: 浮点数
    • end_coord: 浮点数
  • 分割:
    • train: 100个样本,150791字节
  • 下载大小: 95057字节
  • 数据集大小: 150791字节
  • 配置:
    • default: 包含训练数据文件
  • 任务类别:
    • 视频分类
    • 视觉问答
  • 语言: 英语
  • 标签:
    • 危险评估
    • 危险分类
    • 风险评估
    • 危害评估
    • 行业
    • 医疗保健
    • 危险指标
  • 规模类别: n<1K

使用方法

下载和使用数据集

python from datasets import load_dataset

dataset = load_dataset("pranked03/ViDAS")

下载视频并使用OpenCV加载

python i = 0 # 视频索引,范围为0到99

from huggingface_hub import hf_hub_download

file_path = hf_hub_download( repo_id="pranked03/ViDAS", filename=dataset["train"][i]["video_id"], repo_type="dataset" )

import cv2

cap = cv2.VideoCapture(file_path)

if not cap.isOpened(): print("Error: Could not open video.") exit()

while True: ret, frame = cap.read() if not ret: break

cv2.imshow(Video, frame)

if cv2.waitKey(25) & 0xFF == ord(q):
    break

cap.release() cv2.destroyAllWindows()

引用

@misc{gupta2024vidasvisionbaseddangerassessment, title={ViDAS: Vision-based Danger Assessment and Scoring}, author={Pranav Gupta and Advith Krishnan and Naman Nanda and Ananth Eswar and Deeksha Agarwal and Pratham Gohil and Pratyush Goel}, year={2024}, eprint={2410.00477}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2410.00477}, }

搜集汇总
数据集介绍
main_image_url
构建方式
ViDAS数据集的构建基于对YouTube视频内容的深度分析与标注。研究者们精选了100个涵盖多种事件的视频,并由人类参与者对每个视频的危险程度进行评分,评分范围从0(无危险)到10(危及生命)。同时,研究者还利用大型语言模型(LLM)对视频摘要进行独立评估,生成危险评分。通过引入均方误差(MSE)分数,数据集实现了对人类与LLM评估结果的多模态元评估,确保了数据的多样性与可靠性。
特点
ViDAS数据集的特点在于其专注于视频内容的危险评估,提供了详细的危险评分与时间戳信息,能够精确捕捉视频中的危险时刻。数据集不仅包含人类评估结果,还引入了LLM的独立评估,为危险评估提供了多视角分析。此外,数据集涵盖了工业、医疗等多个领域,具有广泛的应用价值。其结构化的元数据与视频文件相结合,为研究者提供了丰富的研究素材。
使用方法
使用ViDAS数据集时,研究者可以通过Hugging Face平台下载元数据,包括视频文件名、危险评分及时间坐标。视频文件可通过Hugging Face Hub下载,并利用OpenCV等库进行加载与处理。通过简单的代码示例,研究者可以轻松访问视频内容,并进行危险评估的相关分析。数据集的多模态特性使其适用于视频分类、视觉问答等多种任务,为危险评估研究提供了便捷的工具与资源。
背景与挑战
背景概述
ViDAS数据集由Pranav Gupta等研究人员于2024年推出,旨在推动视频内容中的危险分析与评估研究。该数据集包含100个YouTube视频,涵盖了多种事件场景,并通过人工参与者对每个视频的危险程度进行了标注,评分范围从0(无危险)到10(危及生命)。此外,数据集还引入了大语言模型(LLM)对视频摘要进行独立评估,以探索其在危险评估中的潜力。ViDAS不仅为视频危险评估提供了新的资源,还展示了LLM在实现类人评估方面的可能性,对计算机视觉和人工智能领域的研究具有重要影响。
当前挑战
ViDAS数据集在构建和应用过程中面临多重挑战。首先,视频内容的危险评估具有主观性,不同标注者可能对同一视频的危险程度存在分歧,这要求数据集在标注过程中需确保一致性和可靠性。其次,大语言模型在评估视频危险时,如何准确理解视频内容并生成与人类评估一致的评分,是一个技术难题。此外,数据集的规模相对较小,仅包含100个视频,可能限制了其在更广泛场景中的应用。如何在保证数据质量的同时扩展数据集规模,是未来研究需要解决的问题。
常用场景
经典使用场景
ViDAS数据集在视频危险评估领域具有重要应用,特别是在危险分类和风险评估任务中。该数据集通过收集100个YouTube视频,并由人类参与者进行危险评分,提供了精确的时间戳和危险等级标注。研究人员可以利用这些数据训练和验证视频分类模型,尤其是那些旨在识别和量化视频内容中危险程度的模型。此外,数据集还支持多模态元评估,通过比较人类与大型语言模型(LLM)的危险评估结果,探索LLM在危险评估中的潜力。
解决学术问题
ViDAS数据集解决了视频内容中危险量化评估的难题,为危险分类和风险评估提供了新的研究资源。通过引入人类标注的危险评分和LLM的独立评估,数据集为多模态元评估提供了基础,帮助研究人员探索LLM在危险评估中的表现。这不仅推动了视频危险评估领域的发展,还为LLM在类似任务中的应用提供了实证支持,具有重要的学术意义。
衍生相关工作
ViDAS数据集的发布催生了一系列相关研究,特别是在视频危险评估和LLM应用领域。基于该数据集,研究人员开发了多种危险分类模型,并探索了LLM在危险评估中的表现。此外,数据集还被用于多模态元评估研究,比较人类与LLM的评估结果,推动了LLM在危险评估任务中的应用。这些研究不仅丰富了视频危险评估的理论体系,还为相关技术的实际应用提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作