有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
BrowseComp-ZH
BrowseComp-ZH 是一个为全面评估大型语言模型(LLM)在中国网络上的浏览能力而设计的基准数据集。该数据集由289个多跳问题组成,涵盖了11个不同的领域,每个问题都经过逆向工程,从一个简短、客观且易于验证的答案(如日期、数字或专有名词)出发。为了确保问题的难度和答案的唯一性,采用了两阶段的质量控制协议。数据集旨在评估LLM在多跳检索、事实推理和在线信息整合方面的能力。数据集、构建指南和基准结果已公开发布。
arXiv 收录
上奇产业通
上奇产业通是依托北京上奇数字科技有限公司(简称“上奇”)自主研发的产业知识计算引擎,推出的新一代“产业情报和智能决策”SaaS账号系统。平台覆盖200余个产业链图、100万种产品、5000万家企业等,利用产业知识计算引擎的数据、算法和模型,提供产业数据和关系的一站式信息搜索、图谱绘制、内容订阅、报告生成、企业尽调、项目推荐等服务,支撑行业研究、精准招商和投资决策等。
北京国际大数据交易所 收录