《全唐诗》数据挖掘
收藏阿里云天池2026-06-09 更新2025-01-04 收录
下载链接:
https://tianchi.aliyun.com/dataset/194690
下载链接
链接失效反馈官方服务:
资源简介:
全唐诗是唐代诗歌的集合,包含了大量关于中国古典诗歌的数据,非常适合进行数据分析和挖掘。
任务要求:
1.数据挖掘:
从全唐诗的数据库或文本中**提取信息**,包括诗人的信息、诗歌的主题、风格、用词等。
2.数据分析:
对挖掘出的数据进行**统计分析**,比如分析不同时期诗歌的流行主题、诗人的写作风格变化。
3.可视化:
利用数据**可视化**的部分,通过图表或图形展示分析结果,使数据更直观易懂。
Quan Tang Shi (Complete Tang Poetry) is a comprehensive collection of Tang Dynasty poetic works, containing a vast amount of data related to classical Chinese poetry, thus rendering it highly suitable for data analysis and mining.
The specified task requirements are as follows:
1. Data Mining: Extract relevant information from the Quan Tang Shi database or text corpus, including poet biographical details, poetic themes, writing styles, and lexical choices, etc.
2. Data Analysis: Perform statistical analysis on the extracted dataset, such as examining the prevalent poetic themes across different historical periods and the evolutionary patterns of poets' writing styles.
3. Visualization: Employ data visualization techniques to display the analysis outcomes through charts or graphs, making the data more intuitive and accessible for understanding.
提供机构:
阿里云天池
创建时间:
2024-12-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集专注于《全唐诗》的文本挖掘,旨在从诗歌中提取诗人信息、主题和风格等关键元素,并进行统计分析与可视化。数据集包含一个文本文件(poem.txt),规模较小(约218KB),适用于数据挖掘入门和古典文学分析任务。作为公共数据集,它采用GPL 2.0许可证,适合用于教育和研究目的。
以上内容由遇见数据集搜集并总结生成



