five

avemio/German-RAG-ORPO-Long-Context-ShareGPT-HESSIAN-AI

收藏
Hugging Face2025-02-06 更新2025-04-08 收录
下载链接:
https://hf-mirror.com/datasets/avemio/German-RAG-ORPO-Long-Context-ShareGPT-HESSIAN-AI
下载链接
链接失效反馈
官方服务:
资源简介:
German-RAG-ORPO长期上下文任务数据集是一个专门用于微调语言模型的数据集,重点关注RAG特定能力。该数据集包含三个子集:具有多个引用的困难问答、以与会者和主题为焦点的会议问答以及以主题为焦点的会议问答。数据子集源自合成数据生成,基于腾讯的千万人格模拟方法,并经过自动验证和审校。

The German-RAG-ORPO Long Context Tasks Dataset is a specialized collection designed for fine-tuning language models with a focus on RAG-specific capabilities. It includes three subsets: hard QA with multiple references, QA meeting attendee topic, and QA meeting topic. These subsets are derived from synthetic data generation inspired by Tencents method of simulating one billion personas, and have been automatically validated and curated.
提供机构:
avemio
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作