five

akkiisfrommars/TreeCorpus

收藏
Hugging Face2025-04-08 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/akkiisfrommars/TreeCorpus
下载链接
链接失效反馈
官方服务:
资源简介:
TreeCorpus是一个全面的、结构化的数据集,从最新的Wikipedia数据中派生出来,经过专门处理,用作对话AI模型的高质量训练数据。该数据集将Wikipedia的百科全书知识转化为优化后的格式,以支持自然语言理解和生成任务。数据集经过精心处理,去除了标记、模板、参考文献等非内容元素,同时保留了Wikipedia文章的信息价值。

TreeCorpus is a comprehensive, structured dataset derived from the latest Wikipedia dumps, specially processed to serve as high-quality training data for conversational AI models. This dataset transforms Wikipedias encyclopedic knowledge into a format optimized for natural language understanding and generation tasks.
提供机构:
akkiisfrommars
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作