BiTe_Corpus
收藏NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://zenodo.org/record/6828325
下载链接
链接失效反馈官方服务:
资源简介:
[ENGLISH] The BiTe_Corpus is a text file (txt.) containing the abstracts published in Spanish collected in the Bibliografía Temática de Historiografía Lingüística Española: fuentes secundarias [Esparza et al. 2008]. It is a document containing 102613 words and 9270 unique words and it is especially conceived for the metahistoriographical study of the history of Hispanic linguistics.
This final corpus was the result of two stages. First, the abstracts that were part of the bibliographic records of the Bibliografía Temática de la Historiografía Lingüística Española. Fuentes secundarias (BiTe) (Esparza et al. 2008). At the beginning of this first stage, the corpus consisted of a total of 296 029 words and 31469 vocablos (unique word occurrences) distributed in 2298 abstracts. Secondly, we proceeded to a second edition taking as a starting point the criteria published by Samper Padilla (1998) and maintaining a conservative stance -as opposed to a uniform one- (Fernández Juncal 2013) when making different decisions about the edition. More information about the editing criteria can be requested from the authors.
[SPANISH] El BiTe_Corpus es un documento de texto que contiene los resúmenes publicados en español reunidos en la Bibliografía Temática de Historiografía Lingüística Española: fuentes secundarias [Esparza et al. 2008]. Se trata de un documento que contiene 102613 palabras y 9270 vocablos únicos y está especialmente concebido para el estudio metahistoriográfico de la historia de la lingüística hispánica.
Este corpus final fue el resultado de dos etapas. En primer lugar, se reunieron los resúmenes que formaban parte de las fichas bibliográficas de la Bibliografía Temática de la Historiografía Lingüística Española. Fuentes secundarias (BiTe) (Esparza et al. 2008). Al inicio de esta primera etapa, el corpus constaba con un total de 296 029 palabras y 31469 vocablos (apariciones únicas de palabras) distribuidos en 2298 resúmenes. En segundo lugar, se procedió a una segunda edición tomando como punto de partida los criterios publicados por Samper Padilla (1998) y manteniendo una postura conservadora –frente a la uniformadora– (Fernández Juncal 2013) a la hora de tomar diferentes decisiones sobre la edición. Puede solicitar más información acerca de los criterios de edición a las autoras.
创建时间:
2024-05-23



