five

Experiment-data-for-UM-S-TM

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Experiment-data-for-UM-S-TM
下载链接
链接失效反馈
官方服务:
资源简介:
这是以下文章的实验数据:@misc{liu2021topic, title={Topic Model Supervised by Understanding Map}, author={Gangli Liu}, year={2021}, eprint={2110.06043}, archivePrefix={arXiv}, primaryClass={cs.CL} } *.txt 文件是论文表4的数据。所有 *.txt 文件的最上面几行是人工文档的内容。列名是:“Topic”、“Distance”、“Topic-len”、“alpha”/“Noise”、“doc concept-length”和“Votes counter”。 3. *.txt文件的文件名编码见“表4:发现的六个文件的SCOM”。 “all_topic”表示候选主题集是域中的所有主题。 4.对于“300docs-提到-in-section3.2.xlsx”文件,其名称说明其内容。
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集为《Topic Model Supervised by Understanding Map》文章的实验数据,包含.txt文件(对应论文表4,记录主题、距离等参数)和.xlsx文件。数据集由清华大学于2021年发布,用于支持主题模型研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作