five

glossAPI/dimodis_logotexnia

收藏
Hugging Face2026-02-24 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/glossAPI/dimodis_logotexnia
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: other license_name: copyrights license_link: LICENSE language: - el --- **Πληροφορίες για τα δεδομένα** Το παρόν dataset περιλαμβάνει κείμενα της ελληνικής γλώσσας χρονολογούμενα από τον 12ο έως και τον 18ο/19ο αιώνα. Περιέχουν αποσπάσματα από αντιπροσωπευτικά έργα της ελληνικής γραμματείας (θρησκευτικά κείμενα, ιπποτικό μυθιστόρημα, Πτωχοπροδρομικά, επική ποίηση, κρητική λογοτεχνία κ.λπ.) καθώς και διδακτικές προτάσεις, που συνοδεύουν αυτόν τον τόσο σημαντικό όγκο κειμένων. Τα αρχεία προσφέρονται σε μορφή csv, ώστε να είναι διαθέσιμα τυχόν σχόλια αλλά και τα metadata τους. Σημειώνεται πως έχει διατηρηθεί ο συλλαβισμός, μαζί με κάποια επιπλέον στοιχεία των χειρογράφων (αστερίσκοι, τελείες, αρίθμηση του χειρογράφου). **Στατιστικά Dataset:** Total tokens: 96006 Size: 384Kb Words Count: 70202 **Δομή Dataset** Το αρχείο dimodous_mathimata.parquet, που περιέχει τα metadata του dataset, έχει την εξής δομή: | Στήλη | Περιγραφή | | --- | --- | | title | Τίτλος κειμένου | | text | Το κείμενο | **Πηγή Δεδομένων:** © Copyright 2015 Κέντρο Ελληνικής Γλώσσας Με επιφύλαξη παντός δικαιώματος. Αυτό το σύνολο δεδομένων περιέχει επεξεργασμένα δεδομένα που προέρχονται από πόρους που ανήκουν στο Κέντρο Ελληνικής Γλώσσας. Τα αρχικά πνευματικά δικαιώματα παραμένουν στο Κέντρο Ελληνικής Γλώσσας. Για οποιοδήποτε ζήτημα, επικοινωνήστε: glossapi.team@eellak.gr **Dataset info** In this dataset, the user will find Greek texts of various periods: from the 12th until the 18th/19th century. It includes fragments from well-known literature texts (Christian texts, Ptochoprodromika, Cretan literature, medieval courtly romance, epic poetry) as well as teaching strategies related to them. The archives are uploaded as CSV, accompanied by comments and their metadata. It is worth mentioning that, is some cases, the spelling is maintained and certain manuscript data (asterisks, gaps and periods, manuscript numbers) haven’t been erased. **Dataset Statistics :** Total tokens: 96006 Size: 384Kb Words Count: 70202 **Dataset structure** The file dimodous_mathimata.parquet, contains the metadata of the dataset, and has the following structure: | Column | Description | | --- | --- | | title | The title of the text| | text | The text | **Source Data:** © Copyright 2015 Κέντρο Ελληνικής Γλώσσας (Center for the Greek Language) All rights reserved. This dataset contains processed data derived from resources owned by the Center for the Greek Language. The original copyrights remain with the Center for the Greek Language. For feedback contact: glossapi.team@eellak.gr
提供机构:
glossAPI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作