古诗数据
收藏阿里云天池2026-05-27 更新2025-08-09 收录
下载链接:
https://tianchi.aliyun.com/dataset/209408
下载链接
链接失效反馈官方服务:
资源简介:
用 PyTorch 从零训练一个两层的 embedding-LSTM 语言模型,专门学习中国古典诗词的韵律与意境。训练数据打包在 tangccc.npz 中,模型权重保存在 model.pth。下面给出两段可直接使用的“开箱即用”说明,一段是 数据内容摘要,一段是 训练/推理脚本示例,方便你快速复现或继续微调。
Train a two-layer embedding-LSTM language model from scratch using PyTorch, specifically for learning the rhythm and artistic conception of classical Chinese poetry. Training data is packaged in tangccc.npz, and model weights are saved in model.pth. Two ready-to-use out-of-the-box instructions are provided below: one is a data content summary, and the other is a training/inference script example, enabling you to rapidly reproduce or further fine-tune the model.
提供机构:
阿里云天池
创建时间:
2025-08-05
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集为'古诗数据',包含用于训练一个专门学习中国古典诗词韵律与意境的两层embedding-LSTM语言模型的数据和模型权重。数据集以'tangccc.npz'文件形式提供,模型权重保存在'model.pth'中,发布于2025年8月5日,大小为40.26MB,采用GPL 2.0许可证,但当前因平台维护升级而暂时不可用。
以上内容由遇见数据集搜集并总结生成



