five

Debate Performance Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://huggingface.co/spaces/lmsys/chatbot-Arena-leaderboard
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了不同大型语言模型(LLM)在一系列开放式话题上的辩论结果。它不仅提供了辩论的详细结果,还根据不同模型对之间的辩论胜场数给出了排名。该数据集的规模为:在25个话题上,模型对之间进行了50场辩论。这一任务旨在通过辩论来评估LLM的表现。
提供机构:
OpenAI, Together.ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作