five

BeaverTails|语言模型安全数据集|评估研究数据集

收藏
arXiv2023-11-07 更新2024-07-30 收录
语言模型安全
评估研究
下载链接:
https://sites.google.com/view/pku-beavertails
下载链接
链接失效反馈
资源简介:
旨在促进大型语言模型(LLMs)安全对齐研究的BeaverTails数据集,独特地将问题-回答对的有用性和无害性注释分开,提供了对这些关键属性的不同视角。总共收集了333,963个问题-答案(QA)对的安全元标签和361,903对专家比较数据,用于有用性和无害性指标。
创建时间:
2023-07-10
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

中国近海地形数据集(渤海,黄海,东海,南海)

本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。

地球大数据科学工程 收录

安徽新能源汽车产业链图谱企业名单数据

根据安徽新能源产业链上下游特点。将安徽新能源产业分为发、储、送、 运共计95个产业链节点。依托佰腾专利大数据资源,将涉及节点的企业进行分类上链,产业链节点上显示的是涉及节点产品的所有企业的详情,通过产业链图谱企业数据集可以精准把握产业链上下游产品节点及链主、伙伴角色,深度挖掘产业链中企业、高校、专家、专利的关联关系,精准匹配产业链产品�

安徽省数据知识产权登记平台 收录

UAVDT Dataset

The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.

datasetninja.com 收录

GFS

数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }

地球大数据科学工程 收录