akkiisfrommars/TreeCorpus
收藏Hugging Face2025-04-08 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/akkiisfrommars/TreeCorpus
下载链接
链接失效反馈官方服务:
资源简介:
TreeCorpus是一个全面的、结构化的数据集,从最新的Wikipedia数据中派生出来,经过专门处理,用作对话AI模型的高质量训练数据。该数据集将Wikipedia的百科全书知识转化为优化后的格式,以支持自然语言理解和生成任务。数据集经过精心处理,去除了标记、模板、参考文献等非内容元素,同时保留了Wikipedia文章的信息价值。
TreeCorpus is a comprehensive, structured dataset derived from the latest Wikipedia dumps, specially processed to serve as high-quality training data for conversational AI models. This dataset transforms Wikipedias encyclopedic knowledge into a format optimized for natural language understanding and generation tasks.
提供机构:
akkiisfrommars



