Global Water Quality Dataset|水质监测数据集|环境研究数据集
收藏
- Global Water Quality Dataset首次发表,由联合国环境规划署(UNEP)和全球水伙伴(Global Water Partnership)联合发布,旨在提供全球水体质量的全面数据。
- 该数据集首次应用于全球水资源管理项目,特别是在非洲和亚洲的多个国家,用于评估和改善当地水体质量。
- Global Water Quality Dataset被纳入联合国可持续发展目标(SDGs)的监测框架,成为评估全球水资源可持续性的关键工具。
- 数据集进行了首次重大更新,增加了来自南美洲和欧洲的新数据,进一步提升了其全球覆盖范围和数据精度。
- 该数据集被广泛应用于多个国际研究项目,包括气候变化对水体质量影响的研究,以及全球水资源分配的优化模型构建。
张家口市下花园区-房屋建筑业-应建防空地下室的民用建筑项目报建审批数据
该数据资源为张家口市下花园区数据和政务服务局在履行应建防空地下室的民用建筑项目报建审批过程中产生,包含建设单位、工程名称等具体信息,可用于防空地下室信息查询,有助于行业主管部门监督管理。
国家公共数据资源登记平台 收录
Matchesfashion, Ltd. eCommerce insights
The eCommerce activity of Matchesfashion, Ltd. amounted to US$410m in 2023. Learn more about their online business including detailed eCommerce revenue analytics.
ecommercedb.com 收录
TruckV2X
TruckV2X数据集是首个以卡车为中心的多模态和多代理协作感知数据集,旨在解决卡车在自动驾驶中面临的独特感知挑战。该数据集利用LiDAR和摄像头进行多模态感知,并包括拖拉机、拖车、CAV和RSU等多代理协作。数据集提供了64个场景,包括88,396帧LiDAR点云、一百万张相机图像和1.18百万个3D边界框注释。该数据集为开发具有增强遮挡处理能力的协作感知系统奠定了基础,并加速了多代理自动驾驶卡车系统的部署。
arXiv 收录
高质量多领域客服对话数据集
高质量多领域客服对话数据集,包含了电子商务、金融服务、电信支持等多个领域,包含丰富的问答对。旨在提供多样化的客户服务场景下的自然语言交互样本。高质量多领域客服对话数据集在大模型领域的应用能够解决以下几个关键问题: 1)聊天机器人训练:通过使用丰富的对话数据,可以训练出更加自然、流畅且能理解复杂用户意图的聊天机器人。 2)智能客服助手:能够提升客服系统的自动化水平,有效解答常见问题,减少人工客服的工作负担,提高服务效率和客户满意度。 3)多轮对话系统开发:支持构建能够进行连贯、上下文相关的多轮对话系统,使得机器能够在对话中保持话题一致性,提供更个性化的交互体验。 4)智能推荐系统:利用对话数据中的用户偏好和行为模式,改进推荐算法,实现更精准的内容和服务推荐。 5)知识库构建:有助于自动或半自动地构建和维护企业或特定领域的知识图谱,为用户提供准确的信息查询服务。 6)语言模型预训练:可以作为预训练数据,帮助语言模型学习多样化的语言结构和表达方式,增强模型的语言理解和生成能力。
北京市数据知识产权 收录
CodeGen
CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。
github.com 收录