Neurolinguistics-based Synthetic Dataset

Name: Neurolinguistics-based Synthetic Dataset
Creator: 印度理工学院德里分校电气工程系
Published: 2022-11-10 21:24:02
License: 暂无描述

arXiv2022-11-10 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2211.05557v1

下载链接

链接失效反馈

官方服务：

资源简介：

本研究创建的Neurolinguistics-based Synthetic Dataset旨在解决Broca's Aphasia患者句子生成问题。该数据集由20,000个训练样本和10,000个测试样本组成，每个样本包含一个语法正确的句子和一个对应的合成失语症句子。数据集通过模拟失语症患者的语言特征，如句子长度、名词/动词比率和简单/复杂句子比率，来生成合成失语症句子。该数据集的应用领域是开发辅助技术，帮助失语症患者更有效地沟通。

提供机构：

印度理工学院德里分校电气工程系

创建时间：

2022-11-10

搜集汇总

数据集介绍

背景与挑战

背景概述

Neurolinguistics-based Synthetic Dataset 是一个用于解决Broca's Aphasia患者句子生成问题的合成数据集，包含30,000个样本（20,000个训练和10,000个测试），每个样本由语法正确句子和模拟失语症语言特征（如句子长度和句子结构比率）的合成句子组成。该数据集旨在开发辅助技术，帮助失语症患者改善沟通效果。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集