five

fineinstructions/documents_and_templates

收藏
Hugging Face2025-08-11 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/fineinstructions/documents_and_templates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个使用DataDreamer工具生成的合成数据集,用于指令模板检索嵌入任务。数据集包含文档(document)和查询(queries)字符串,以及结果(results)中的chunks和indices整数序列。数据集有一个完整的split,大小为3219090754字节,共有499168个示例。数据集的下载大小为1956915421字节。

This dataset is a synthetic dataset generated using the DataDreamer tool for instruction template retrieval embedding tasks. The dataset includes document and query strings, as well as sequences of integers for chunks and indices in the results. There is a full split in the dataset, which is 3219090754 bytes in size and contains 499168 examples. The download size of the dataset is 1956915421 bytes.
提供机构:
fineinstructions
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作