five

SIQA (Social Interaction QA)|社交智能数据集|自然语言处理数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
社交智能
自然语言处理
下载链接:
https://opendatalab.org.cn/OpenDataLab/SIQA
下载链接
链接失效反馈
资源简介:
社交IQa: 社交互动QA,用于测试社交常识智能的新问答基准。与许多以前侧重于物理或分类学知识的基准相反,社会IQa侧重于对人们的行为及其社会影响的推理。例如,给定一个像 “杰西看到了一场音乐会” 这样的动作和一个像 “杰西为什么这样做?”,人类可以很容易地推断出杰西想要 “看他们最喜欢的表演者” 或 “欣赏音乐”,而不是 “看里面发生了什么” 或 “看它是否有效”。社交IQa中的动作跨越了各种各样的社交场合,并且答案候选者既包含人为策划的答案,也包含经过对手过滤的机器生成的候选者。社交IQa包含37,000多个QA对,用于评估模型对日常事件和情况的社会影响进行推理的能力。
提供机构:
OpenDataLab
创建时间:
2023-09-04
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

Coffee_Shop_Sales

该数据集包含了咖啡店的详细交易信息,包括交易ID、日期、时间、店铺编号、位置、产品类别、类型、名称、价格、月份、日期、星期和小时等属性。数据集用于分析咖啡店的销售情况,如收入和交易量的变化趋势。

github 收录