Corpus_Dataset
收藏github2022-05-27 更新2024-05-31 收录
下载链接:
https://github.com/SukritJaAIproject/corpus_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由普通人员(data team)和心理学专家(psy. team)标注,包含多种格式的数据文件,如.npy和.csv,用于训练模型。
This dataset is annotated by both general staff (data team) and psychology experts (psy. team), encompassing data files in various formats such as .npy and .csv, intended for model training.
创建时间:
2022-04-18
原始信息汇总
数据集概述
数据团队标注数据集
- 数据路径:
- x_path: drive/MyDrive/tech_own/x_data_team/
- y_path: drive/MyDrive/tech_vdo/csv/numpy/new_class_name/int_class/convert2/
- csv_path: drive/MyDrive/tech_vdo/csv/
- 数据文件:
- x_data: [face001.npy, face002.npy, face003.npy, face004.npy, face005.npy, face006.npy, face007.npy, face008.npy, pilot01.npy, pilot02.npy, pilot03.npy, pilot04.npy, pilot05.npy]
- y_data: [face001.npy, face002.npy, face003.npy, face004.npy, face005.npy, face006.npy, face007.npy, face008.npy, pilot01.npy, pilot02.npy, pilot03.npy, pilot04.npy, pilot05.npy]
- csv_files: [face001.csv, face002.csv, face003.csv, face004.csv, face005.csv, face006.csv, face007.csv, face008.csv, pilot01.csv, pilot02.csv, pilot03.csv, pilot04.csv, pilot05.csv]
心理团队标注数据集
- 数据路径:
- x_path: drive/MyDrive/tech_vdo/csv_psy/x_train/
- y_path: drive/MyDrive/tech_vdo/csv_psy/v2/convert2/
- csv_path: drive/MyDrive/tech_vdo/csv_psy/v2/
- 数据文件:
- x_data: [01.npy, 02_v1.npy, 03.npy, 04.npy, 05.npy, 06.npy, 07.npy, 08.npy, pilot01.npy, pilot02.npy, pilot03.npy, pilot04.npy, pilot05.npy]
- y_data: [01.npy, 02.npy, 03.npy, 04.npy, 05.npy, 06.npy, 07.npy, 08.npy, pilot01.npy, pilot02.npy, pilot03.npy, pilot04.npy, pilot05.npy]
- csv_files: [01_df.csv, 02_df.csv, 03_df.csv, 04_df.csv, 05_df.csv, 06_df.csv, 07_df.csv, 08_df.csv, pilot01_df.csv, pilot02_df.csv, pilot03_df.csv, pilot04_df.csv, pilot05_df.csv]
数据团队与心理团队匹配数据集
- 数据路径: drive/MyDrive/tech_own/4_matching/
- 数据文件:
- csv_files: [face001_data_psy.csv, face002_data_psy.csv, face003_data_psy.csv, face004_data_psy.csv, face005_data_psy.csv, face006_data_psy.csv, face007_data_psy.csv, face008_data_psy.csv, pilot01_data_psy.csv, pilot02_data_psy.csv, pilot03_data_psy.csv, pilot04_data_psy.csv, pilot05_data_psy.csv]
- x_data: [face001_ai_x.npy, face002_ai_x.npy, face003_ai_x.npy, face004_ai_x.npy, face005_ai_x.npy, face006_ai_x.npy, face007_ai_x.npy, face008_ai_x.npy, pilot01_ai_x.npy, pilot02_ai_x.npy, pilot03_ai_x.npy, pilot04_ai_x.npy, pilot05_ai_x.npy]
- y_data: [face001_ai_y.npy, face002_ai_y.npy, face003_ai_y.npy, face004_ai_y.npy, face005_ai_y.npy, face006_ai_y.npy, face007_ai_y.npy, face008_ai_y.npy, pilot01_ai_y.npy, pilot02_ai_y.npy, pilot03_ai_y.npy, pilot04_ai_y.npy, pilot05_ai_y.npy]
数据集文件存储链接
搜集汇总
数据集介绍

构建方式
Corpus_Dataset的构建过程涉及多个团队的合作,数据团队和心理学团队分别负责数据的标注和处理。数据团队通过普通用户进行数据标注,而心理学团队则由专业心理学家进行标注。数据集以.npy和.csv文件形式存储,分别包含图像数据和对应的标签信息。数据集的构建路径清晰,分为不同的版本和过滤后的数据集,确保了数据的多样性和准确性。
特点
Corpus_Dataset的特点在于其多源标注和丰富的文件格式支持。数据集不仅包含了普通用户和专业心理学家的标注,还提供了多种格式的数据文件,如.npy和.csv,便于不同场景下的使用。此外,数据集还提供了详细的路径信息和文件命名规则,方便用户快速定位和使用所需数据。数据集的多样性和专业性使其在心理学和机器学习领域具有广泛的应用潜力。
使用方法
使用Corpus_Dataset时,用户可以通过提供的Google Drive链接访问.npy和.csv文件。.npy文件用于模型训练,而.csv文件则提供了对.npy文件的详细描述。用户可以根据需要选择不同版本的数据集,如原始数据集或过滤后的数据集。数据集的使用路径和文件名规则清晰,用户只需按照提供的路径信息加载相应文件即可开始使用。数据集的多格式支持和详细说明使其易于集成到各种机器学习工作流中。
背景与挑战
背景概述
Corpus_Dataset是一个专注于面部表情和行为分析的多模态数据集,由数据团队和心理学团队共同构建。该数据集的核心研究问题在于通过面部表情和行为数据的结合,探索人类情感和心理状态的识别与分类。数据集的构建始于近年来,主要研究人员来自多个学术机构,旨在为情感计算和心理学研究提供高质量的数据支持。该数据集的影响力不仅体现在情感识别领域,还为跨学科研究提供了丰富的数据资源,推动了人工智能与心理学的深度融合。
当前挑战
Corpus_Dataset在构建过程中面临多重挑战。首先,数据标注的准确性至关重要,尤其是心理学团队的标注需要基于复杂的心理状态分析,这对标注人员的专业素养提出了极高要求。其次,数据集的多样性和代表性也是一个关键问题,如何确保数据涵盖不同文化背景和个体差异,是构建过程中需要克服的难题。此外,数据格式的统一与整合也带来了技术挑战,尤其是如何将不同来源的数据(如npy和csv文件)高效整合并确保其一致性。这些挑战不仅影响了数据集的构建效率,也对后续的研究应用提出了更高的要求。
常用场景
经典使用场景
Corpus_Dataset在面部表情识别和心理学研究中具有广泛的应用。该数据集通过提供由普通人和心理学家标注的面部表情数据,为研究者提供了丰富的训练和测试材料。经典的使用场景包括面部表情的自动识别、情感计算以及心理学实验中的情绪分析。这些应用场景不仅推动了计算机视觉领域的发展,也为心理学研究提供了新的工具和方法。
实际应用
在实际应用中,Corpus_Dataset被广泛用于开发智能监控系统、情感识别软件以及心理健康评估工具。例如,在智能监控系统中,该数据集可以用于训练模型以识别公共场所中的异常情绪状态,从而提升公共安全。在心理健康领域,数据集可以帮助开发自动化的情绪评估工具,辅助心理学家进行情绪障碍的诊断和治疗。
衍生相关工作
基于Corpus_Dataset,研究者们开发了多种面部表情识别模型和情感计算算法。例如,一些经典工作利用该数据集训练了深度学习模型,实现了高精度的面部表情分类。此外,该数据集还催生了一系列心理学研究,探讨了不同文化背景下的情感表达差异。这些衍生工作不仅推动了相关领域的技术进步,也为跨学科研究提供了宝贵的数据支持。
以上内容由遇见数据集搜集并总结生成



