汕头市龙湖区卫健局政务服务事项办理项申报材料信息|政务服务数据集|卫生健康数据集
收藏ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录
Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Adver-City
Adver-City是由皇后大学计算学院创建的第一个开源多模态协作感知数据集,专注于恶劣天气条件。该数据集包含超过24,000帧和890,000个标注,涵盖110个独特场景,涉及六种不同的天气条件。数据集内容包括来自车辆和路边单元的LiDAR、RGB和语义分割相机、GNSS和IMU数据。创建过程基于CARLA模拟器和OpenCDA框架,场景设计基于真实事故报告,旨在模拟恶劣天气和低能见度条件下的最相关道路配置。该数据集主要用于测试和改进自动驾驶车辆在恶劣天气条件下的感知模型,解决传感器性能下降和物体检测困难的问题。
arXiv 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录