Natural Stories
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Natural_Stories
下载链接
链接失效反馈官方服务:
资源简介:
Natural Stories 数据集由经过编辑的英文文本组成,其中包含许多低频句法结构,同时对母语人士来说仍然很流利。语料库使用手动校正的解析树进行注释,并包括自定进度的阅读时间数据。
The Natural Stories Dataset is composed of edited English texts that feature a large number of low-frequency syntactic structures while still being fluent for native speakers. The corpus is annotated with manually corrected parse trees and includes self-paced reading time data.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
Natural Stories是一个由编辑过的英文文本组成的数据集,其特点是包含低频句法结构,但对母语人士仍保持流畅性。该数据集通过手动校正的解析树进行注释,并提供了自定进度的阅读时间数据,适用于自然语言处理和语言建模研究,采用CC BY-NC-SA 4.0许可证。
以上内容由遇见数据集搜集并总结生成



