Speech Corpus for Korean Children with Autism Spectrum Disorder

Name: Speech Corpus for Korean Children with Autism Spectrum Disorder
Creator: 首尔国立大学
Published: 2024-02-23 15:32:54
License: 暂无描述

arXiv2024-02-23 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2402.15539v1

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集名为‘韩国自闭症谱系障碍儿童语音语料库’，由首尔国立大学语言学系创建，旨在为韩国自闭症儿童提供专门的语音资源，以促进发音和严重程度评估等语音技术的发展。数据集包含300名自闭症儿童和50名典型发展儿童的语音记录，这些记录来自语音和语言评估会话，并已转录和标注了发音和语言特征。数据集的创建过程涉及对语音数据的收集、转录和专业标注，旨在通过分析语音和语言特征，识别与临床评分相关的显著特征，从而为自闭症儿童的社交沟通严重程度和发音能力提供自动评估系统。

This dataset is named 'Korean Speech Corpus for Children with Autism Spectrum Disorder', and was developed by the Department of Linguistics, Seoul National University. Its core objective is to provide dedicated speech resources for South Korean children with autism, so as to facilitate the advancement of speech technologies including pronunciation assessment and severity evaluation. The corpus contains speech recordings from 300 children with autism and 50 typically developing children, which were collected during speech and language assessment sessions, and have undergone transcription and professional annotation of phonetic and linguistic features. The dataset creation workflow encompasses speech data collection, transcription and professional annotation, with the aim of identifying significant features correlated with clinical scores through analysis of speech and linguistic characteristics, thereby enabling the construction of an automatic assessment system for evaluating the severity of social communication and pronunciation abilities among children with autism.

提供机构：

首尔国立大学

创建时间：

2024-02-23

搜集汇总

数据集介绍

构建方式

在自闭症谱系障碍（ASD）儿童言语评估领域，该数据集的构建采用了系统化采集方法。数据来源于韩国言语语言治疗中心，由持证言语语言病理学家（SLP）在标准化的言语语言评估会话中进行录音。会话内容涵盖发音、语言技能及词汇理解等多个维度，并依据儿童年龄和语言发展水平选用相应评估工具。录音设备采用Logitech Blue Yeti麦克风，置于天花板中心以避免干扰儿童注意力。数据采集计划涵盖300名ASD儿童和50名典型发展（TD）儿童，目前已完成73名ASD儿童和9名TD儿童的录音与标注。所有音频均经过转写，并标注了发音错误、语言特征及非语言声音等多类信息。

特点

该数据集的核心特点在于其专业性与多维标注体系。作为首个针对韩语ASD儿童的言语语料库，它不仅提供了原始音频和音位转写，还包含了由三位经验丰富的言语语言病理学家独立评定的社会沟通严重程度（SCS）和发音熟练度（PP）临床评分。SCS评分基于DSM-5标准分为三个等级，PP评分则采用ADOS-2中的语调评估项目。数据集还涵盖了丰富的元数据，如儿童年龄、性别及语言评估结果，并标注了即时回声语言、离题话语等语言特征。其高评分者间信度（ICC值均高于0.93）确保了临床评分的可靠性，为研究提供了扎实的基础。

使用方法

该数据集主要应用于ASD儿童言语特征的自动评估系统开发。研究者可利用其音频数据提取声学特征，如基频、梅尔频率倒谱系数、语音质量和语速参数，并结合转写文本分析词汇、句法等语言特征。临床评分可作为监督学习的标签，用于训练分类或回归模型，以自动预测SCS等级或PP分数。初步分析已表明，声学特征中的语音质量参数与SCS和PP显著相关，而语言特征则与社交沟通参与度紧密相连。未来研究可进一步结合正交转写数据，深入探讨发音错误与语言使用模式，推动数字化诊疗工具的发展。

背景与挑战

背景概述

在自闭症谱系障碍（ASD）儿童数字疗法需求日益增长的背景下，针对韩语ASD儿童的专用语音语料库长期处于空白状态。2024年，首尔国立大学语言学系的Seonwoo Lee、Jihyun Mun、Sunhee Kim与Minhwa Chung等人共同构建了首个面向韩语ASD儿童的语音语料库，旨在通过语音技术实现发音能力与社会沟通严重程度的自动评估。该语料库采集自ASD儿童在语言评估会话中的语音记录，并由三位言语语言病理学家依据临床标准对社交沟通严重性及发音熟练度进行标注。其核心研究问题聚焦于如何利用声学与语言学特征，揭示ASD儿童的语音特质与临床评分之间的关联，从而推动自动化评估系统的发展，为ASD的精准干预提供数据基础。

当前挑战

该语料库致力于解决ASD儿童语音自动评估领域的双重挑战：在领域问题层面，现有临床评估依赖主观判断，且缺乏针对韩语ASD儿童的标准化语音数据，导致自动化评估模型难以训练与验证；在构建过程中，面临数据采集的复杂性，包括儿童注意力分散、语音清晰度低以及临床评分需多位专家协同标注以确保信度。此外，语音转写需平衡音位与正字法表征，以兼顾发音错误检测与语言特征分析，同时需克服数据规模有限与隐私保护之间的平衡难题。

常用场景

经典使用场景

在自闭症谱系障碍（ASD）的临床研究与数字疗法开发领域，针对韩国儿童的语言特征分析长期面临数据匮乏的挑战。该数据集通过系统采集自闭症儿童在语言评估会话中的语音记录，并辅以社会沟通严重程度与发音熟练度的临床评分，为研究者提供了首个专门针对韩国自闭症儿童的大规模语音资源。其经典应用场景在于支持基于机器学习的自动评估模型开发，例如利用声学与语言学特征构建分类器，以客观量化儿童的社会沟通能力与发音水平，从而辅助临床诊断与干预规划。

解决学术问题

该数据集有效应对了自闭症研究中的若干关键学术问题。首先，它填补了韩语环境下针对自闭症儿童语音数据集的空白，使得跨语言比较与文化特异性研究成为可能。其次，通过提供由三位言语语言病理学家评定的临床分数，数据集缓解了传统评估中主观性强、专家依赖度高的问题，为监督学习提供了可靠标签。此外，数据集涵盖的声学与语言学特征分析揭示了自闭症儿童在基频、语音质量及词汇使用等方面的独特模式，深化了对自闭症言语表型的理解，并为开发客观、可扩展的自动评估工具奠定了实证基础。

衍生相关工作

该数据集的发布催生了一系列相关研究，尤其在自闭症语音分析领域。例如，基于数据集声学特征的工作探索了梅尔频率倒谱系数与语音质量参数在区分自闭症亚组中的效能，推动了特征工程方法的优化。同时，结合语言学特征的研究进一步开发了用于社会沟通严重程度预测的多模态模型。这些衍生工作不仅验证了数据集的可靠性，还拓展了其在机器学习、语音处理及临床语言学交叉领域的应用，为后续构建更精准、可解释的自动评估系统提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集