five

HELM

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HELM
下载链接
链接失效反馈
官方服务:
资源简介:
语言模型采用文本并生成文本: 尽管语言模型很简单,但它正越来越多地充当从问题回答到摘要的几乎所有语言技术的基础。但是他们的巨大能力和风险还没有得到很好的理解。语言模型的整体评估 (HELM) 是一个活着的基准,旨在提高语言模型的透明度。

Language models take text as input and generate text as output. Despite their conceptual simplicity, they are increasingly serving as the foundational underpinning for nearly all language technologies ranging from question answering to text summarization. However, their substantial capabilities and associated risks remain poorly understood. The Holistic Evaluation of Language Models (HELM) is a living benchmark designed to enhance the transparency of language models.
提供机构:
OpenDataLab
创建时间:
2023-09-04
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HELM(语言模型的整体评估)是由斯坦福大学于2022年发布的一个开源基准数据集,采用Apache 2.0许可证,大小为802.0B。该数据集旨在通过全面评估语言模型的能力和风险,提高其透明度,覆盖问题回答、摘要等多种语言技术应用,是一个持续更新的活着的基准工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作