five

RAG-Resources

收藏
魔搭社区2025-12-05 更新2025-06-21 收录
下载链接:
https://modelscope.cn/datasets/PleIAs/RAG-Resources
下载链接
链接失效反馈
官方服务:
资源简介:
This repository aims to be a collection of open datasets for Retrieval-Augmented Generation. Each directory includes both a full text version and an embedding version as a zipped lancedb file. For now the repository includes one collection: Greek and Latin literature translated in English, digitized by the Perseus project as 143,000 chunks.

本开源仓库旨在打造面向检索增强生成(Retrieval-Augmented Generation)的开源数据集合集。每个子目录均包含纯文本版本与嵌入版本,其中嵌入版本以压缩LanceDB文件格式存储。目前本仓库仅收录一组数据集:由珀尔修斯项目(Perseus Project)数字化的英译古希腊与古罗马文学作品,共计143,000个文本分块。
提供机构:
maas
创建时间:
2025-06-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作