glossAPI/dimodis_logotexnia
收藏Hugging Face2026-02-24 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/glossAPI/dimodis_logotexnia
下载链接
链接失效反馈官方服务:
资源简介:
---
license: other
license_name: copyrights
license_link: LICENSE
language:
- el
---
**Πληροφορίες για τα δεδομένα**
Το παρόν dataset περιλαμβάνει κείμενα της ελληνικής γλώσσας χρονολογούμενα από τον 12ο έως και τον 18ο/19ο αιώνα. Περιέχουν αποσπάσματα από αντιπροσωπευτικά έργα της ελληνικής γραμματείας (θρησκευτικά κείμενα, ιπποτικό μυθιστόρημα, Πτωχοπροδρομικά, επική ποίηση, κρητική λογοτεχνία κ.λπ.) καθώς και διδακτικές προτάσεις, που συνοδεύουν αυτόν τον τόσο σημαντικό όγκο κειμένων.
Τα αρχεία προσφέρονται σε μορφή csv, ώστε να είναι διαθέσιμα τυχόν σχόλια αλλά και τα metadata τους. Σημειώνεται πως έχει διατηρηθεί ο συλλαβισμός, μαζί με κάποια επιπλέον στοιχεία των χειρογράφων (αστερίσκοι, τελείες, αρίθμηση του χειρογράφου).
**Στατιστικά Dataset:**
Total tokens: 96006
Size: 384Kb
Words Count: 70202
**Δομή Dataset**
Το αρχείο dimodous_mathimata.parquet, που περιέχει τα metadata του dataset, έχει την εξής δομή:
| Στήλη | Περιγραφή |
| --- | --- |
| title | Τίτλος κειμένου |
| text | Το κείμενο |
**Πηγή Δεδομένων:**
© Copyright 2015 Κέντρο Ελληνικής Γλώσσας
Με επιφύλαξη παντός δικαιώματος.
Αυτό το σύνολο δεδομένων περιέχει επεξεργασμένα δεδομένα που προέρχονται από πόρους που ανήκουν στο Κέντρο Ελληνικής Γλώσσας. Τα αρχικά πνευματικά δικαιώματα παραμένουν στο Κέντρο Ελληνικής Γλώσσας.
Για οποιοδήποτε ζήτημα, επικοινωνήστε: glossapi.team@eellak.gr
**Dataset info**
In this dataset, the user will find Greek texts of various periods: from the 12th until the 18th/19th century. It includes fragments from well-known literature texts (Christian texts, Ptochoprodromika, Cretan literature, medieval courtly romance, epic poetry) as well as teaching strategies related to them.
The archives are uploaded as CSV, accompanied by comments and their metadata. It is worth mentioning that, is some cases, the spelling is maintained and certain manuscript data (asterisks, gaps and periods, manuscript numbers) haven’t been erased.
**Dataset Statistics :**
Total tokens: 96006
Size: 384Kb
Words Count: 70202
**Dataset structure**
The file dimodous_mathimata.parquet, contains the metadata of the dataset, and has the following structure:
| Column | Description |
| --- | --- |
| title | The title of the text|
| text | The text |
**Source Data:**
© Copyright 2015 Κέντρο Ελληνικής Γλώσσας (Center for the Greek Language)
All rights reserved.
This dataset contains processed data derived from resources owned by the Center for the Greek Language. The original copyrights remain with the Center for the Greek Language.
For feedback contact: glossapi.team@eellak.gr
提供机构:
glossAPI



