KaiLiu1998/smooth_reading
收藏Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/KaiLiu1998/smooth_reading
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
pretty_name: Smooth Reading
license: mit
size_categories:
- 100K<n<1M
tags:
- text
- conversational
- long-context
- synthetic
- datasets
task_categories:
- text-generation
configs:
- config_name: one_round
data_files:
- split: train
path: one_round.jsonl
- config_name: non_end_to_end_multi_round
data_files:
- split: train
path: non_end_to_end_multi_round.jsonl
- config_name: end_to_end_multi_round
data_files:
- split: train
path: end_to_end_multi_round.jsonl
---
# Smooth Reading
This dataset accompanies the paper [Smooth Reading: Bridging the Gap of Recurrent LLM to Self-Attention LLM on Long-Context Understanding](https://iclr.cc/virtual/2026/poster/10010461).
---
license: mit
---
语言:英语
展示名称:流畅阅读
许可证:MIT许可证
规模类别:10万 < 样本量 < 100万
标签:
- 文本
- 对话式
- 长上下文(long-context)
- 合成生成
- 数据集
任务类别:
- 文本生成
配置项:
- 配置名称:单轮对话
数据文件:
- 拆分集:训练集
文件路径:one_round.jsonl
- 配置名称:非端到端多轮对话
数据文件:
- 拆分集:训练集
文件路径:non_end_to_end_multi_round.jsonl
- 配置名称:端到端多轮对话
数据文件:
- 拆分集:训练集
文件路径:end_to_end_multi_round.jsonl
# 流畅阅读
本数据集配套论文《流畅阅读:弥合循环式大语言模型(Recurrent LLM)与自注意力大语言模型(Self-Attention LLM)在长上下文理解上的差距》,论文链接:https://iclr.cc/virtual/2026/poster/10010461。
---
许可证:MIT许可证
---
提供机构:
KaiLiu1998



