five

dinggd/50salads

收藏
Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/dinggd/50salads
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en tags: - video understanding --- # GTEA <!-- Provide a quick summary of the dataset. --> This is the 50Salads dataset used for temporal action segmentation. ## Dataset Details ### Dataset Description <!-- Provide a longer summary of what this dataset is. --> - **Curated by:** [More Information Needed] - **Funded by [optional]:** [More Information Needed] - **Shared by [optional]:** [More Information Needed] - **Language(s) (NLP):** [More Information Needed] - **License:** [More Information Needed] ### Dataset Sources [optional] <!-- Provide the basic links for the dataset. --> - **Repository:** [More Information Needed] - **Paper [optional]:** [More Information Needed] - **Demo [optional]:** [More Information Needed] ## Uses <!-- Address questions around how the dataset is intended to be used. --> ### Direct Use <!-- This section describes suitable use cases for the dataset. --> ```python from datasets import load_dataset SPLIT = 1 dataset = load_dataset("dinggd/50salads", name=f"split{SPLIT}") # traing data for x in dataset["train"]: video_id, video_feature, video_label = x # test data for x in dataset["test"]: video_id, video_feature, video_label = x ``` ### Out-of-Scope Use <!-- This section addresses misuse, malicious use, and uses that the dataset will not work well for. --> [More Information Needed] ## Dataset Structure <!-- This section provides a description of the dataset fields, and additional information about the dataset structure such as criteria used to create the splits, relationships between data points, etc. --> [More Information Needed] ## Dataset Creation ### Curation Rationale <!-- Motivation for the creation of this dataset. --> [More Information Needed] ### Source Data <!-- This section describes the source data (e.g. news text and headlines, social media posts, translated sentences, ...). --> #### Data Collection and Processing <!-- This section describes the data collection and processing process such as data selection criteria, filtering and normalization methods, tools and libraries used, etc. --> [More Information Needed] #### Who are the source data producers? <!-- This section describes the people or systems who originally created the data. It should also include self-reported demographic or identity information for the source data creators if this information is available. --> [More Information Needed] ### Annotations [optional] <!-- If the dataset contains annotations which are not part of the initial data collection, use this section to describe them. --> #### Annotation process <!-- This section describes the annotation process such as annotation tools used in the process, the amount of data annotated, annotation guidelines provided to the annotators, interannotator statistics, annotation validation, etc. --> [More Information Needed] #### Who are the annotators? <!-- This section describes the people or systems who created the annotations. --> [More Information Needed] #### Personal and Sensitive Information <!-- State whether the dataset contains data that might be considered personal, sensitive, or private (e.g., data that reveals addresses, uniquely identifiable names or aliases, racial or ethnic origins, sexual orientations, religious beliefs, political opinions, financial or health data, etc.). If efforts were made to anonymize the data, describe the anonymization process. --> [More Information Needed] ## Bias, Risks, and Limitations <!-- This section is meant to convey both technical and sociotechnical limitations. --> [More Information Needed] ### Recommendations <!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. --> Users should be made aware of the risks, biases and limitations of the dataset. More information needed for further recommendations. ## Citation [optional] <!-- If there is a paper or blog post introducing the dataset, the APA and Bibtex information for that should go in this section. --> **BibTeX:** [More Information Needed] **APA:** [More Information Needed] ## Glossary [optional] <!-- If relevant, include terms and calculations in this section that can help readers understand the dataset or dataset card. --> [More Information Needed] ## More Information [optional] [More Information Needed] ## Dataset Card Authors [optional] [More Information Needed] ## Dataset Card Contact [More Information Needed]

language: - en tags: - 视频理解(video understanding) --- # GTEA <!-- 请对该数据集提供简要概述。 --> 本数据集为用于时序动作分割(temporal action segmentation)的50Salads数据集。 ## 数据集详情 ### 数据集描述 <!-- 请提供该数据集的详细概述。 --> - **整理方:** [需补充更多信息] - **资助方(可选):** [需补充更多信息] - **共享方(可选):** [需补充更多信息] - **(自然语言处理)语言:** [需补充更多信息] - **许可证:** [需补充更多信息] ### 数据集来源(可选) <!-- 请提供该数据集的基础链接。 --> - **代码仓库:** [需补充更多信息] - **相关论文(可选):** [需补充更多信息] - **演示Demo(可选):** [需补充更多信息] ## 数据集用途 <!-- 请说明该数据集的预期使用场景相关问题。 --> ### 直接使用 <!-- 本节描述该数据集的适用用例。 --> python from datasets import load_dataset SPLIT = 1 dataset = load_dataset("dinggd/50salads", name=f"split{SPLIT}") # 训练数据 for x in dataset["train"]: video_id, video_feature, video_label = x # 测试数据 for x in dataset["test"]: video_id, video_feature, video_label = x ### 超出适用范围的使用 <!-- 本节说明误用、恶意使用以及本数据集无法良好适配的使用场景。 --> [需补充更多信息] ## 数据集结构 <!-- 本节提供数据集字段的描述,以及有关数据集结构的额外信息,例如划分数据集所使用的标准、数据点之间的关系等。 --> [需补充更多信息] ## 数据集构建 ### 构建初衷 <!-- 说明创建该数据集的动机。 --> [需补充更多信息] ### 源数据 <!-- 本节描述源数据(例如新闻文本与标题、社交媒体帖子、翻译后的句子等)。 --> #### 数据收集与处理流程 <!-- 本节描述数据收集与处理过程,例如数据选择标准、过滤与归一化方法、所使用的工具与库等。 --> [需补充更多信息] #### 源数据生产者 <!-- 本节描述最初创建该数据的个人或系统。若可获取源数据创作者的自我报告人口统计或身份信息,也应在此处说明。 --> [需补充更多信息] ### 标注信息(可选) <!-- 若数据集包含非初始数据收集阶段产生的标注信息,请使用本节描述相关内容。 --> #### 标注流程 <!-- 本节描述标注过程,例如标注所使用的工具、标注的数据量、向标注者提供的标注指南、标注者间一致性统计、标注验证等。 --> [需补充更多信息] #### 标注者信息 <!-- 本节描述创建标注信息的个人或系统。 --> [需补充更多信息] #### 个人与敏感信息 <!-- 说明数据集是否包含可被视为个人、敏感或隐私的数据(例如揭示地址、唯一可识别的姓名或别名、种族或族裔起源、性取向、宗教信仰、政治观点、财务或健康数据等)。若已对数据进行匿名化处理,请说明匿名化过程。 --> [需补充更多信息] ## 偏差、风险与局限性 <!-- 本节旨在说明技术与社会技术层面的局限性。 --> ### 建议 <!-- 本节旨在针对偏差、风险与技术局限性提出相关建议。 --> 用户应充分知晓本数据集存在的风险、偏差与局限性,相关进一步建议需补充更多信息。 ## 引用信息(可选) <!-- 若有介绍该数据集的论文或博客文章,此处应包含其APA与Bibtex格式的引用信息。 --> **BibTeX格式:** [需补充更多信息] **APA格式:** [需补充更多信息] ## 术语表(可选) <!-- 若有需要,请在此处包含可帮助读者理解数据集或数据集卡片的术语与计算公式。 --> [需补充更多信息] ## 更多信息(可选) [需补充更多信息] ## 数据集卡片作者(可选) [需补充更多信息] ## 数据集卡片联系人 [需补充更多信息]
提供机构:
dinggd
原始信息汇总

GTEA

数据集详情

数据集描述

  • 语言(NLP): 英语
  • 标签: 视频理解

使用方法

直接使用

python from datasets import load_dataset

SPLIT = 1 dataset = load_dataset("dinggd/50salads", name=f"split{SPLIT}")

训练数据

for x in dataset["train"]: video_id, video_feature, video_label = x

测试数据

for x in dataset["test"]: video_id, video_feature, video_label = x

推荐

用户应了解数据集的风险、偏见和技术限制。更多信息需要进一步推荐。

搜集汇总
数据集介绍
main_image_url
构建方式
50Salads数据集的构建旨在支持时间动作分割任务的研究。该数据集通过收集和处理与烹饪相关的视频片段,涵盖了多种烹饪动作,为模型提供了丰富的动作序列数据。尽管具体的构建细节如数据收集和处理方法、标注过程等尚未详细披露,但其设计初衷显然是为了推动视频理解领域的发展,特别是针对时间序列动作的识别与分割。
特点
50Salads数据集的主要特点在于其专注于时间动作分割任务,提供了丰富的烹饪动作序列数据。这些数据不仅涵盖了多种烹饪动作,还可能包含动作的开始和结束时间点,从而为模型提供了精确的时间信息。此外,数据集的结构设计可能支持多种分割方式,便于研究人员进行不同层次的分析和模型训练。
使用方法
使用50Salads数据集进行模型训练和测试时,用户可以通过HuggingFace的datasets库加载数据。具体操作包括指定数据集的分割方式(如split1),并分别加载训练和测试数据。在加载数据后,用户可以获取视频ID、视频特征和视频标签,从而进行模型的训练和评估。这种使用方式使得数据集能够广泛应用于时间动作分割任务的研究和模型开发。
背景与挑战
背景概述
50Salads数据集是一个专门用于时间动作分割任务的视频数据集。该数据集的核心研究问题在于如何准确地识别和分割视频中的动作序列,这对于视频理解领域具有重要意义。尽管数据集的创建时间、主要研究人员或机构等具体信息尚未明确,但其对视频理解领域的贡献不容忽视。通过提供丰富的视频数据和相应的动作标签,50Salads数据集为研究人员提供了一个标准化的基准,以评估和改进时间动作分割算法。
当前挑战
50Salads数据集在构建过程中面临多项挑战。首先,时间动作分割任务本身具有复杂性,要求算法能够准确识别视频中动作的开始和结束时间。其次,数据集的标注过程可能涉及大量的人工干预,如何确保标注的一致性和准确性是一个重要问题。此外,视频数据的多样性和复杂性也给数据处理和模型训练带来了技术上的挑战。最后,数据集的使用范围和潜在的偏见问题也需要进一步研究和探讨,以确保其在实际应用中的可靠性和公平性。
常用场景
经典使用场景
在视频理解领域,dinggd/50salads数据集主要用于时间动作分割任务。该数据集通过提供详细的视频片段及其对应的动作标签,支持研究人员开发和评估动作识别与分割算法。通过加载数据集,研究者可以获取视频ID、视频特征和视频标签,从而进行模型训练和测试。
实际应用
在实际应用中,dinggd/50salads数据集可用于开发智能家居系统中的动作识别模块,例如厨房自动化系统中的烹饪动作识别。此外,它还可应用于视频监控系统,帮助识别和分类监控视频中的特定动作,提升安全监控的效率和准确性。
衍生相关工作
基于dinggd/50salads数据集,研究者们开发了多种动作识别和分割算法,如基于深度学习的动作识别模型和时间序列分析方法。这些工作不仅提升了动作识别的准确性,还为视频理解领域的其他相关研究提供了基础,如视频摘要生成和视频内容检索等。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作