holistic-ai/Personality_mypersonality|性格分析数据集|文本数据数据集
收藏数据集概述
数据特征
- text: 数据类型为字符串。
- answer: 数据类型为字符串。
数据分割
- train:
- 字节数: 1060810.1672884945
- 样本数: 7933
- test:
- 字节数: 265302.83271150547
- 样本数: 1984
数据大小
- 下载大小: 644690 字节
- 数据集大小: 1326113.0 字节
配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
- data_files:

海天瑞声-超大规模中文多领域高质量多轮对话语料库
这是一个符合中国人表达习惯的自然对话数据集,共计约1,0000,000轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话这两种方式,兼顾分布的代表性、多样性和样本规模。
魔搭社区 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
GID(Gaofen Image Dataset)
GID 是具有高分二号(GF-2)卫星图像的大规模土地覆盖数据集。这个新的数据集被命名为高分图像数据集(GID),由于其覆盖范围大、分布广、空间分辨率高,优于现有的土地覆盖数据集。 GID由两部分组成:大规模分类集和精细土地覆盖分类集。大规模分类集包含 150 个像素级标注的 GF-2 图像,精细分类集由 30,000 个多尺度图像块加上 10 个像素级标注的 GF-2 图像组成。分别基于 5 个类别的训练和验证图像收集和重新标记 15 个类别的训练和验证数据。
OpenDataLab 收录
FACED
FACED数据集是由清华大学脑与智能实验室和智能技术与系统国家重点实验室共同创建,包含从123名参与者收集的32通道EEG信号,用于情感计算研究。数据集通过记录参与者观看28个情感诱发视频片段时的EEG信号构建,旨在通过EEG信号分析情感状态。创建过程中,数据经过标准化和统一预处理,设计了四个EEG分类任务。该数据集主要应用于情感识别和脑机接口领域,旨在解决情感计算中的分类问题,提高情感识别的准确性和效率。
arXiv 收录