Lk123/SyntheticData
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lk123/SyntheticData
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置都包含查询、正面示例、负面示例、查询指令和段落指令等特征。部分配置还包含少样本示例查询和少样本示例段落。数据集主要用于训练模型,可能涉及查询与段落匹配或相关任务。
该数据集包含多个配置,每个配置都包含查询、正面示例、负面示例、查询指令和段落指令等特征。部分配置还包含少样本示例查询和少样本示例段落。数据集主要用于训练模型,可能涉及查询与段落匹配或相关任务。
提供机构:
Lk123
原始信息汇总
数据集概述
配置一:data_GPT35_num12k_examplenum4_withexample_0407
- 特征:
- query: 字符串
- pos: 字符串序列
- neg: 字符串序列
- query_instruction: 字符串
- passage_instruction: 字符串
- fewshot_example_query: 字符串序列
- fewshot_example_passage: 字符串序列
- 分割:
- train:
- 字节数: 228935972
- 示例数: 45107
- train:
- 下载大小: 66066246
- 数据集大小: 228935972
配置二:data_GPT35_num12k_examplenum4_withoutexample_0407
- 特征:
- query: 字符串
- pos: 字符串序列
- neg: 字符串序列
- query_instruction: 字符串
- passage_instruction: 字符串
- 分割:
- train:
- 字节数: 92768574
- 示例数: 45107
- train:
- 下载大小: 43210041
- 数据集大小: 92768574
配置三:data_GPT35_num9k_examplenum4_withexample_0409
- 特征:
- query: 字符串
- pos: 字符串序列
- neg: 字符串序列
- query_instruction: 字符串
- passage_instruction: 字符串
- fewshot_example_query: 字符串序列
- fewshot_example_passage: 字符串序列
- 分割:
- train:
- 字节数: 176902465
- 示例数: 35012
- train:
- 下载大小: 51489195
- 数据集大小: 176902465
配置四:data_GPT35_num9k_examplenum4_withoutexample_0409
- 特征:
- query: 字符串
- pos: 字符串序列
- neg: 字符串序列
- query_instruction: 字符串
- passage_instruction: 字符串
- 分割:
- train:
- 字节数: 71358317
- 示例数: 35012
- train:
- 下载大小: 33642806
- 数据集大小: 71358317



