five

likhitjuttada/ft-embeddingmodel-RAG-dataset

收藏
Hugging Face2025-10-18 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/likhitjuttada/ft-embeddingmodel-RAG-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于微调嵌入模型的基模板,目的是提高在RAG管道中的检索性能。数据集是通过在Ollama上使用Mistral:7B模型,通过简单的提示生成每个文档块的5个问题而本地生成的,这些文档块来自苹果公司的《2024年环境进展报告》。

This dataset aims to be a base template for fine-tuning embedding models for enhanced retrieval performance in RAG pipelines. It has been generated locally using Mistral:7B on Ollama using a simple prompt that prompts the model to generate 5 questions for each document chunk of Apples Environmental Progress Report 2024.
提供机构:
likhitjuttada
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作