five

Integrating Approaches to the Role of Metaphor in the Evolutionary Dynamics of Language

收藏
DataCite Commons2024-10-16 更新2025-04-16 收录
下载链接:
https://repod.icm.edu.pl/citation?persistentId=doi:10.18150/7LWW8R
下载链接
链接失效反馈
官方服务:
资源简介:
POLSKI1. Informacje ogólneTytuł zbioru danych: Zintegrowane podejście do roli metafory w ewolucji językaKierownik grantu: dr Michael PleyerWspółwykonawca: dr Marek Placińskikontakt: Marek Placiński, marpla@umk.plData zbiórki danych: marzec 2023Miejsce zbiórki danych: Toruń, Polskasłowa-klucze: wielkie modele językowe, automatyczna identyfikacja metafory, językoznawstwo komputerowe, teoria metafory konceptualnej, ewolucja kulturowa językaźródło finansowania: Narodowe Centrum Nauki, program Polonez Bis, umowa nr 2021/43/P/HS2/02729.2. Opis danychcode.zip zawiera kod napisany w języku Python, który posłużył do 1) dopasowania wielkiego modelu językowego PolBERT do naszego zbioru danych 2) obliczenia entropii informacyjnej 3) zidentyfikowanie wyrażeń potencjalnie metaforycznych na podstawie entropiiDataset.zip zawiera dwie bazy danych: zbiór tekstów zawierających interesujące nas słowa-klucze (patrz powiązany artykuł). Teksty pochodzą z dwóch korpusów, Elektroniczny korpus tekstów polskich z XVII i XVIII w. (https://korba.edu.pl/query_corpus/) oraz Mikrokorpus polszczyzny 1830-1918 (http://www.f19.uw.edu.pl/2017/01/korpus-wersja-zaktualizowana/)data utworzenia danych: 12.06.20243. Licencja: CC0 1.0 Universal4. Zbiórka danychDane zostały automatycznie wyekstrahowane z korpusów Elektroniczny korpus tekstów polskich z XVII i XVIII w. oraz Mikrokorpus polszczyzny 1830-1918 (http://www.f19.uw.edu.pl/2017/01/korpus-wersja-zaktualizowana/)5. Informacja o danychnazwy zmiennych:metaphorical - czy dane słowo ma znaczenie metaforyczneword - lemat słowa-kluczasent - zdanie, w którym dane słowo występujeENGLISH1. General informationTitle:Integrating Approaches to the Role of Metaphor in the Evolutionary Dynamics of LanguagePI: Michael Pleyer, PhDCo-investigator: Marek Placiński, PhDcontact information: Marek Placiński, marpla@umk.plDate of data collection: czerwiec/lipiec 2024Geographic location of data collection: Toruń, Polskakeywords: large language models, computational linguistics, automatic metaphor identification, evolutionary linguistics, conceptual metaphor theorysource of funding: National Science Centre, Poland, Polonez Bis program, agreement no 2021/43/P/HS2/02729.2. Data and file overviewcode.zip - contains Python code that was used to 1) fine-tune PolBERT LLM to our downstream task, 2) compute information entropy, 3) identify potentially metaphorical words based on enthropyDataset.zip contains two dataset: a collection of texts that contain keywords (see the related paper). The texts come from two corpora, Elektroniczny korpus tekstów polskich z XVII i XVIII w. (https://korba.edu.pl/query_corpus/) and Mikrokorpus polszczyzny 1830-1918 (http://www.f19.uw.edu.pl/2017/01/korpus-wersja-zaktualizowana/)The files were created on 12.06.20243. Licence: CC0 1.0 Universal4. Methodological informationMethods: the data was automatically extracted from Elektroniczny korpus tekstów polskich z XVII i XVIII w. (https://korba.edu.pl/query_corpus/) and Mikrokorpus polszczyzny 1830-1918 (http://www.f19.uw.edu.pl/2017/01/korpus-wersja-zaktualizowana/)5. Data-specific informationnames of variables:metaphorical - whether the word is metaphoricalword - keyword lemmasent - the sentence in which the keyword is attested
提供机构:
RepOD
创建时间:
2024-10-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作