Nekochu/Tree-of-Web-Knowledge
收藏Hugging Face2024-06-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nekochu/Tree-of-Web-Knowledge
下载链接
链接失效反馈官方服务:
资源简介:
该数据集受到Tree of Knowledge (ToK)的启发,并重新设计为Proof of Concept,称为Tree-of-Web-Knowledge (ToWK)。数据集使用llama2创建,并通过llm-blender/PairRM进行清理和去重。可能的改进方向包括使用自定义的Web搜索代替JSON对象。
Inspired by Tree of Knowledge (ToK), now remade as Proof of Concept: Tree-of-Web-Knowledge aka ToWK. Alpaca Dataset created using llama2, cleaned using score of llm-blender/PairRM and dedup. Possible improvement: custom Web search instead of JSON obj.
提供机构:
Nekochu
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别:
- 问答
- 文本到文本生成
- 语言: 英语
数据集来源与处理
- 灵感来源于Tree of Knowledge (ToK),现重制为Proof of Concept: Tree-of-Web-Knowledge (TWoK)。
- 使用llama2创建的Alpaca数据集,清理过程使用了llm-blender/PairRM和dedup的评分。
改进建议
- 建议使用VinciGit00/Scrapegraph-ai进行自定义网页搜索,替代JSON对象。



