five

rwq-elo/rwq-questions

收藏
Hugging Face2024-03-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rwq-elo/rwq-questions
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-4.0 --- # RWQ Dataset This dataset containes 20,772 questions to ensure that the evaluation of LLMs accurately reflects their use in practical scenarios, we assemble a dataset called "Real-World Questions" (RWQ). It comprises authentic questions sourced from various platforms such as [Google Trends](https://trends.google.com/trends/)(Transforming Google Trends entries into formulated questions with GPT-4), [Quora](https://www.quora.com/), [ShareGPT](https://sharegpt.com/), [LMSYS-Chat-1M](https://huggingface.co/datasets/lmsys/lmsys-chat-1m), and [AlpacaEval](https://huggingface.co/datasets/tatsu-lab/alpaca_eval). ## Basic Statistics | source | | |---|---| | Google Trend | 26.0% | | LMSYS-Chat-1M | 24.6% | | ShareGPT | 24.2% | | Quora | 21.3% | | AlpacaEval | 3.9% | ## Citation TOOD
提供机构:
rwq-elo
原始信息汇总

RWQ Dataset

概述

RWQ数据集包含20,772个问题,旨在确保对大型语言模型(LLMs)的评估能够准确反映其在实际场景中的使用。该数据集名为“Real-World Questions”(RWQ),由来自多个平台的真实问题组成,包括Google Trends(通过GPT-4将Google Trends条目转化为结构化问题)、QuoraShareGPTLMSYS-Chat-1MAlpacaEval

基本统计

来源 比例
Google Trends 26.0%
LMSYS-Chat-1M 24.6%
ShareGPT 24.2%
Quora 21.3%
AlpacaEval 3.9%

引用

TOOD

搜集汇总
背景与挑战
背景概述
该数据集名为RWQ(Real-World Questions),包含20,772个真实世界问题,旨在评估大语言模型在实用场景中的表现。数据来源于多个平台,包括Google Trends、Quora、ShareGPT、LMSYS-Chat-1M和AlpacaEval,其中Google Trends占比最高(26.0%),确保了问题的多样性和真实性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作