five

glossAPI/Sxolika_vivlia

收藏
Hugging Face2024-12-09 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/glossAPI/Sxolika_vivlia
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - el pretty_name: Σχολικά βιβλία / Greek public school textbooks --- **Πληροφορίες για τα δεδομένα** Το παρόν Dataset περιλαμβάνει ελληνικά σχολικά βιβλία της πρωτοβάθμιας και δευτεροβάθμιας εκπαίδευσης. Αποτελείται από 123 κείμενα, έχοντας αφαιρέσει τα ξενόγλωσσα βιβλία (αγγλικά, γερμανικά, γαλλικά), τα τετράδια εργασιών και τα βιβλία του καθηγητή. Τα βιβλία έχουν καθαριστεί προγραμματιστικά με στόχο να παραδίδει κείμενο από την πρώτη μέχρι την τελευταία σελίδα που ενδιαφέρει τον μαθητή. Έχουν αφαιρεθεί επίσης βιβλιογραφία και γλωσσάρια/ευρετήρια. Ο κώδικας καθαρισμου διατίθεται ελεύθερα στο github του glossAPI. Εξαιτίας του αυτόματου καθαρισμού ενδέχεται κάποια από τα παραπάνω στοιχεία να έχουν παραμείνει ή περισσότερα αυτών να έχουν αφαιρεθεί. **Δήλωση Πνευματικών Δικαιωμάτων** Τα δεδομένα αυτά προέρχονται από σχολικά βιβλία που διατίθενται από το Υπουργείο Παιδείας της Ελλάδας μέσω του επίσημου δικτυακού τόπου ebooks.edu.gr. Η χρήση τους γίνεται για ερευνητικούς και επιστημονικούς σκοπούς, σύμφωνα με τους όρους διάθεσης του Υπουργείου Παιδείας. Για ανατροφοδότηση επικοινωνήστε: glossapi.team@eellak.gr **Dataset info** The Greek Primary and Secondary school textbooks dataset is a set of 123 school books of Primary and Secondary Education. It contains all texts and all subjects taught at school, except of foreign language books, workbooks, and teachers' books. The books have been cleaned programmatically with the aim of retaining the text from first to last page of interest to the student. Bibliography, and glossaries have been removed. The code used to clean the texts is accessible at glossAPI github repo. Due to the automatic nature of the cleaning the texts might still contain some of the above elements (exercises etc.), and chunks of text beyond those elements might be missing. **Copyright Notice** This dataset is derived from textbooks provided by the Greek Ministry of Education through their official website ebooks.edu.gr. The data is used for research and scientific purposes in accordance with the terms of use set by the Ministry of Education. For feedback contact: glossapi.team@eellak.gr
提供机构:
glossAPI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作