Sandbox Alignment Data|模型反馈数据集|交互优化数据集
收藏Stable Alignment 数据集概述
数据集简介
Stable Alignment 项目旨在提供一种优于RLHF的对齐学习方法,具有高效的数据学习和易于扩展部署的特点。该方法通过直接训练模拟社交游戏中的交互数据,避免了训练额外奖励模型可能带来的优化问题。
数据集内容
- 社交模拟代码:用于在沙盒环境中运行社交模拟。
- 169K 交互数据:用于对齐训练的交互数据。
- 训练代码:使用稳定对齐方法进行训练的代码。
- So(cially)-Good 语言模型:训练好的语言模型。
数据统计
sandbox_v1.json
数据类型 / 社交代理类型 | text-davinci-002 | text-davinci-003 | ChatGPT | 总计 |
---|---|---|---|---|
对齐模仿 | 9.8k | 10k | 10k | 29.8k |
自我批评 | 17k | 20k | 20k | 57k |
重新对齐 | 3.3k | 3k | 0.7k | 7k |
总计 | 30.1k | 33k | 30.7k | 93.8k |
sandbox_v2.json
数据类型 / 社交代理类型 | text-davinci-002 | text-davinci-003 | GPT4 | 总计 |
---|---|---|---|---|
对齐模仿 | 18.2k | 10.4k | 20.2k | 48.8k |
自我批评 | 36.3k | 18.3k | 40k | 94.6k |
重新对齐 | 18.2k | 3.4k | 4.0k | 25.6k |
总计 | 72.7k | 32.1k | 64.2k | 169k |
训练方法
使用 torchrun
命令进行训练,支持多GPU训练,训练参数包括模型路径、数据路径、训练轮数、批量大小等。
模型发布
- better-base:基于LLaMA训练的模型,使用AlpacaDataCleaned和codealpaca数据集。
- hh-rlhf-sft:在better-base基础上使用Anthropic HH-RLHF数据集进行监督微调的模型。
- socially-good-lm:在hh-rlhf-sft基础上使用稳定对齐方法训练的社会对齐语言模型。
引用
如果使用本数据集或代码,请引用以下论文: bibtex @misc{liu2023sociallyaligned, title={Training Socially Aligned Language Models in Simulated Human Society}, author={Ruibo Liu and Ruixin Yang and Chenyan Jia and Ge Zhang and Denny Zhou and Andrew M. Dai and Diyi Yang and Soroush Vosoughi}, year={2023}, eprint={2305.16960}, archivePrefix={arXiv}, primaryClass={cs.CL} }

PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2024)
地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2024年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2024)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。
国家青藏高原科学数据中心 收录
google-10000-english
该数据集包含10,000个最常用的英语单词,按频率排序,来源于Google的万亿词料库的n-gram频率分析。数据集可用于多种应用,如打字训练程序,其中7,000个最常用的英语词汇已覆盖约90%的日常使用。
github 收录
中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录