five

FELM|语言模型评估数据集|事实错误检测数据集

收藏
arXiv2023-11-28 更新2024-06-21 收录
语言模型评估
事实错误检测
下载链接:
https://github.com/hkust-nlp/felm
下载链接
链接失效反馈
资源简介:
FELM数据集是由香港科技大学开发的一个用于评估大型语言模型真实性的基准。该数据集收集了来自不同领域的响应,并进行了细致的真实性标注,旨在帮助研究人员和开发者识别和改进语言模型中的事实错误。数据集包含817个样本,覆盖了从世界知识到数学和推理等多个领域,通过细粒度的文本段落标注,可以精确地定位特定的事实错误。此外,数据集还提供了预定义的错误类型和参考链接,以支持或反驳声明,从而推动更可靠的语言模型的发展。
提供机构:
香港科技大学
创建时间:
2023-10-02
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Google Scholar

Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。

scholar.google.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录