five

New Brown Corpus

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/New_Brown_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
我们引入了一个新的数据集,用于训练和评估扎根的语言模型。我们的数据是在虚拟现实环境中收集的,旨在模拟语言前儿童可能可以访问的语言数据的质量: 即自然主义的自发语音与丰富的视觉空间上下文相结合。我们使用收集到的数据来比较动词学习的几种分布语义模型。我们评估基于2D (像素) 特征的神经模型以及基于3D (符号,空间) 特征的特征工程模型,并表明两种建模方法都无法达到令人满意的性能。我们的结果与儿童语言习得的证据一致,该证据强调了从幼稚的分布数据学习动词的难度。我们讨论了未来基于认知的基础语言学习工作的途径,并发布了语料库,以促进对该主题的研究。
提供机构:
OpenDataLab
创建时间:
2022-05-25
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作