five

anon-lsr-2026/lsr-anchoring-results

收藏
Hugging Face2026-04-29 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/anon-lsr-2026/lsr-anchoring-results
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了一篇论文的所有实验结果、激活缓存和运行日志,论文主题是关于低资源非洲语言的安全恢复机制。数据集涵盖了6种语言和4种模型家族,使用了Mean Activation Steering和Sparse Autoencoder (SAE)技术来引导模型行为,而无需微调。

This dataset contains all experimental results, activation caches, and run logs for the paper on mechanistic safety recovery for low-resource African languages. It covers 6 languages and 4 model families, using Mean Activation Steering and Sparse Autoencoder (SAE)-derived mean-activation directions to steer model behaviour without fine-tuning.
提供机构:
anon-lsr-2026
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作