yimingwang123/grade-aware-llm-training-data
收藏Hugging Face2025-07-29 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/yimingwang123/grade-aware-llm-training-data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1,107,690个高质量的指令调优示例,旨在使大型语言模型能够精确地将文本简化到特定的阅读年级水平,并保持语义一致性。数据集包括来自维基百科、简易维基百科和教育内容集合的多样化来源,并使用改进的混合可读性评估模型进行年级预测。数据集还经历了严格的语义一致性过滤,以确保简化的文本质量。该数据集适用于教育技术、无障碍工具、内容管理、阅读评估、大型语言模型微调和研究。
This dataset contains 1,107,690 high-quality instruction-tuning examples for grade-aware text simplification, designed for fine-tuning large language models to simplify text to specific reading grade levels with precision and semantic consistency.
提供机构:
yimingwang123



