有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
SENTIBENCH
SENTIBENCH是一个综合性的情感分析基准,由哈尔滨工业大学(深圳)的研究团队开发。该数据集包含3个典型类别:基本情感分析、多方面情感分析和细粒度情感分析,覆盖了12个代表性任务及其对应的数据集。它旨在系统地评估LLM在情感分析方面的能力,涵盖从文档到句子级别的情感分类,以及更复杂的情感状态识别和细粒度情感元素分析等任务。
arXiv 收录
基层理论宣讲统计信息
莱西市院上镇人民政府基层理论宣讲统计信息
山东公共数据开放网 收录
hallucination_dataset
该数据集收集了用于训练自然语言推理(NLI)模型以检测幻觉的公共数据集。数据集特征包括用户问题、当前文本、命题、标签(布尔类型)和索引级别(整数类型)。数据集分为训练集,包含95545个样本,主要用于文本分类和句子相似度任务,支持英语和葡萄牙语,标签为幻觉检测和奖励,数据集大小在100K到1M之间。
huggingface 收录
Tree (DSD)
The dataset provides information of the Tree by the Drainage Services Department.
空间数据共享平台 收录
DeepPCB
DeepPCB是由上海交通大学图像处理与模式识别研究所创建的首个公开PCB缺陷检测数据集,包含1,500对标注了6种常见PCB缺陷位置的图像。数据集通过模板匹配技术确保图像对齐,减少预处理工作量。每对图像包括一个640x640像素的无缺陷模板和一个有缺陷的测试图像。数据集旨在解决PCB制造中的自动缺陷检测问题,提高检测效率和准确性。
arXiv 收录