five

UHGEval|自然语言处理数据集|模型评估数据集

收藏
arXiv2024-05-24 更新2024-06-21 收录
自然语言处理
模型评估
下载链接:
https://iaar-shanghai.github.io/UHGEval/
下载链接
链接失效反馈
资源简介:
UHGEval数据集是由中国人民大学信息学院、高级算法研究所和媒体融合生产技术与系统国家重点实验室联合开发的,专注于评估中文大型语言模型在无约束生成环境下的幻觉现象。该数据集包含超过5000个实例,每个实例都标有关键词级别的幻觉信息。数据集的内容主要来源于2015年至2017年的中文新闻文章,涵盖政治、经济、科技、社会等多个领域。创建过程中,采用了无约束生成方法,即直接将文本输入模型,不加任何限制地获取输出结果。UHGEval数据集的应用领域主要集中在语言模型的可靠性和准确性评估,旨在解决模型在实际应用中可能产生的幻觉问题,提高语言模型在专业场景中的实用性。
提供机构:
中国人民大学信息学院,北京,中国 †高级算法研究所,上海,中国 ‡媒体融合生产技术与系统国家重点实验室,北京,中国
创建时间:
2023-11-26
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Open Power System Data

Open Power System Data is a free-of-charge data platform dedicated to electricity system researchers. We collect, check, process, document, and publish data that are publicly available but currently inconvenient to use. The project is a service provider to the modeling community: a supplier of a public good. Learn more about its background or just go ahead and explore the data platform.

re3data.org 收录

Global Solar Dataset

在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。

github 收录

Desert Knowledge Australia Solar Centre PV Power Data

该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录