five

CDB_results_finetuned_mistral

收藏
Hugging Face2025-08-12 更新2025-08-13 收录
下载链接:
https://huggingface.co/datasets/de-abreu/CDB_results_finetuned_mistral
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本和相关特征,如黄金标准、注释、推理等,以及与情感和认知状态相关的浮点数特征,如欲望、信念、反事实、无望和平局处理。数据集分为训练集,可用于机器学习模型的训练。
创建时间:
2025-08-07
原始信息汇总

数据集概述

基本信息

  • 数据集名称: CDB_results_finetuned_mistral
  • 下载大小: 19203字节
  • 数据集大小: 24223字节
  • 训练集样本数: 65

数据结构

  • 特征:
    • text: 字符串类型
    • golden: 字符串类型
    • annotation: 字符串类型
    • reasoning: 字符串类型
    • Desire: 浮点数类型
    • Belief: 浮点数类型
    • Counterfactual: 浮点数类型
    • Not-Hope: 浮点数类型
    • breaking_ties: 浮点数类型

数据划分

  • 训练集:
    • 字节数: 24223
    • 样本数: 65
搜集汇总
数据集介绍
main_image_url
构建方式
在认知行为分析领域,CDB_results_finetuned_mistral数据集的构建采用了精细化的标注流程。该数据集基于65个文本样本,通过结构化标注框架捕获了包括Desire、Belief、Counterfactual等多维度认知特征。每个样本均包含原始文本、黄金标准、人工标注及推理过程四重信息层级,数值型特征采用float64格式以保证计算精度,文本特征则保留原始语言表征。
特点
该数据集最显著的特点在于其多维认知特征的量化表征,不仅包含传统的情感极性分析,更创新性地引入了Desire、Belief等心理学维度的连续变量标注。文本与数值特征的有机结合,为研究认知状态与语言表达的关系提供了独特视角。数据样本虽数量有限,但每个样本均经过深度标注,形成了包含原始文本、标准答案、人工标注和逻辑推理的完整证据链。
使用方法
使用该数据集时,研究者可通过text字段获取原始语言材料,结合golden字段验证模型输出准确性。annotation和reasoning字段为认知行为分析提供了可解释性研究素材,而各类float64特征适用于回归分析或分类任务。建议先通过小样本分析理解多维特征的关联性,再建立端到端的认知状态预测模型。
背景与挑战
背景概述
CDB_results_finetuned_mistral数据集是近年来在自然语言处理领域兴起的一项重要资源,专注于探索文本情感与认知状态的深层次关联。该数据集由匿名研究团队构建,其核心研究问题聚焦于通过多维语义标注(如Desire、Belief等认知维度)解析人类语言背后的心理状态。作为对传统情感分析框架的突破性扩展,该数据集为心理学与人工智能的交叉研究提供了量化分析基础,显著推动了认知计算模型的发展进程。
当前挑战
该数据集面临的挑战主要体现在两方面:在领域问题层面,如何准确界定文本中隐含的复杂认知状态(如Counterfactual等抽象概念)仍存在标注标准不统一的学术争议;在构建过程中,细粒度情感维度(如Not-Hope与breaking_ties的区分)的标注需要语言学与心理学的双重专业知识,导致标注成本高昂且易出现主观偏差。同时,65个样本的小规模特性对深度学习模型的泛化能力提出了严峻考验。
常用场景
经典使用场景
在认知行为分析领域,CDB_results_finetuned_mistral数据集通过其多维度的情感和认知特征标注,为研究者提供了深入探索人类心理活动的宝贵资源。该数据集最经典的使用场景是训练和评估自然语言处理模型,特别是在情感识别和认知推理任务中,模型能够基于文本内容预测个体的欲望、信念等心理状态。
解决学术问题
该数据集有效解决了心理学与计算语言学交叉领域中的若干关键问题,如情感计算的细粒度分类、认知状态的量化分析等。通过提供带有详细标注的文本数据,研究者能够更准确地建模人类心理过程,推动情感计算和认知科学的发展,为心理健康辅助诊断等应用奠定理论基础。
衍生相关工作
基于该数据集,研究者们已开展了一系列经典工作,包括开发新型的情感计算模型、认知状态预测算法等。这些工作不仅拓展了数据集的应用范围,还促进了心理学与人工智能的深度融合,为后续研究提供了重要的参考和借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作