amaiamurillo/FundeuRAE
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/amaiamurillo/FundeuRAE
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含4,635条从FundéuRAE检索的语言学建议,FundéuRAE是一家致力于推广西班牙语正确使用的知名机构。该机构在其网站上发布每日建议,基于在主要西班牙语媒体中检测到的疑问。数据集通过网页抓取收集了截至5月3日的所有语言学建议。数据集可用于通过检索增强生成来提高大型语言模型的元语言知识,从而增加这些模型在处理西班牙语语言学查询时的准确性和可靠性。数据结构包括每条建议的内容和类别(如语法、词汇、拼写和视觉化)。
This dataset contains 4,635 linguistics recommendations retrieved from FundéuRAE, a prestigious institution dedicated to promoting the correct use of Spanish. This institution publishes on its website a daily recommendation on the correct use of Spanish, based on the doubts detected in the main Spanish-speaking media. The dataset has been created by collecting through web scraping all these linguistic recommendations until 3 May. It could be used to improve the metalinguistic knowledge of Large Language Models through Retrieval Augmented Generation, thereby increasing the accuracy and reliability of these models when addressing linguistic queries in Spanish. The dataset structure includes the content of each recommendation and its category (e.g., grammar, lexicon, spelling, visualization).
提供机构:
amaiamurillo
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-sa-3.0
- 任务类别: 文本生成
- 语言: 西班牙语
- 数据集名称: Recomendaciones Lingüística de la FundéuRAE
- 数据规模: 1K<n<10K
数据来源
- 来源机构: FundéuRAE
- 数据描述: 该数据集包含4,635条从FundéuRAE获取的语言学推荐,该机构致力于推广西班牙语的正确使用。数据集通过网络爬虫收集,涵盖了截至2023年5月3日的所有语言学推荐。
数据集结构
- Recomendación: 包含FundéuRAE提供的语言学推荐的字符串。
- Categoría: 指示语言学推荐类型的字符串。
- 语法
- 词汇
- 拼写
- 视觉呈现
用途
- 应用场景: 用于通过检索增强生成(Retrieval Augmented Generation)提升大型语言模型的元语言知识,从而提高这些模型在处理西班牙语语言查询时的准确性和可靠性。
联系信息
- 数据集卡片联系人: amaia.mule@gmail.com



