five

藏文文献全文数据库

收藏
国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64f0826abb16e06dfdc78c6f&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
藏文文献全文数据库是藏文文献全文数据库是采用藏文文字识别技术对藏文文献进行数字化,形成可查阅可复制的全文数据库。具体包含文献的元数据(名称、出版时间、出版机构、类型等信息)和文献全文内容。其中文献本身是对现有已出版的文献进行扫描和收集,项目不享有版权,项目使用项目研究成果对文献进行了加工处理。

The Tibetan Literature Full-text Database digitizes existing Tibetan literature through Tibetan text recognition technology, creating an accessible and reproducible full-text database. Specifically, it includes two core components: the metadata of the documents (covering information such as the document title, publication date, publishing institution, and document type) and the full text content of the literature. The source materials are collected and scanned from publicly available published works; this project does not hold any copyright over the original publications, and only processes the documents using the research outcomes of the project.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个采用藏文文字识别技术对藏文文献进行数字化处理的全文数据库,包含文献的元数据和全文内容,数据量达425.9GB,文件数为149856个。它基于已出版的文献扫描收集而成,项目不享有原始文献版权,但通过技术加工实现了可查阅和复制的数字化资源。作为国家重点研发计划项目的成果,该数据库专注于计算机应用和人工智能领域,旨在促进藏文文献的保存与共享。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务