aigrant/tw_chatbot_arena
收藏Hugging Face2025-07-22 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/aigrant/tw_chatbot_arena
下载链接
链接失效反馈官方服务:
资源简介:
TW Chatbot Arena数据集是一个开源数据集,旨在支持基于人类反馈的强化学习(RLHF)。该数据集包含英语和中文(主要是繁体中文)的对话数据,主要用于语言模型的开发和评估。数据集包括用户与聊天机器人的交互数据,每个交互都根据响应质量标记为“chosen”或“rejected”。数据集的结构包括多个特征,如question_id、model_a、model_b、winner、judge、conversation_a、conversation_b、turn、anony、language、tstamp等。数据集分为两个配置:all和argilla,每个配置都有训练集,包含不同数量的字节和示例。数据集的使用遵循Argilla格式,便于集成到训练框架中。
TW Chatbot Arena数据集是一个开源数据集,旨在支持基于人类反馈的强化学习(RLHF)。该数据集包含英语和中文(主要是繁体中文)的对话数据,主要用于语言模型的开发和评估。数据集包括用户与聊天机器人的交互数据,每个交互都根据响应质量标记为“chosen”或“rejected”。数据集的结构包括多个特征,如question_id、model_a、model_b、winner、judge、conversation_a、conversation_b、turn、anony、language、tstamp等。数据集分为两个配置:all和argilla,每个配置都有训练集,包含不同数量的字节和示例。数据集的使用遵循Argilla格式,便于集成到训练框架中。
提供机构:
aigrant



