Classical Chinese Poetry Translation Dataset|机器翻译数据集|古典文学数据集
收藏
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
CBIS-DDSM
该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。
github 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
INTERACTION Dataset
INTERACTION数据集是由加州大学伯克利分校机械系统控制实验室等多个国际研究机构合作创建的,旨在为自动驾驶领域提供高质量的交互式驾驶场景数据。该数据集包含多种复杂的交互式驾驶场景,如城市/高速公路/匝道合并和车道变更、环形交叉口、信号交叉口等,覆盖多个国家和文化背景,以自然方式包含不同文化的驾驶偏好和风格。数据集强调高度交互和复杂的驾驶行为,包括对抗性和合作性运动,以及从常规安全操作到危险、接近碰撞的操纵。此外,数据集提供完整的语义地图信息,包括物理层、参考线、车道连接和交通规则,记录自无人机和交通摄像头。该数据集适用于运动预测、模仿学习、决策制定和规划、表示学习、交互提取和社会行为生成等研究领域,旨在解决自动驾驶中的关键问题。
arXiv 收录
ZuantuSet
ZuantuSet是一个包含超过71,000个中国历史视觉化和108,000个插图的数据集。该数据集由北京大学的一般人工智能国家重点实验室和智能科学技术学院通过半自动化的管道收集和提取历史书籍中的视觉化内容而构建。数据集涵盖了从公元前550年到1950年的中国历史视觉化作品。该数据集不仅揭示了历史中国视觉化的独特设计模式,还分析了其背后的历史和文化成因,为数字人文领域的研究提供了丰富的资源。
arXiv 收录