chess-evaluations|国际象棋数据集|引擎评估数据集
收藏Lichess Evaluations 数据集
数据集描述
- 数据集大小: 227,340,112 行
- 数据集来源: 由 Lichess 分析板 生成,使用 Stockfish 引擎在不同深度和节点数下评估的 83,025,738 个国际象棋位置。
数据集字段
fen
:string
, 棋盘位置的 FEN 表示,仅包含棋子、活动方、王车易位权和吃过路兵的格子。line
:string
, 主变体,使用 UCI 格式。depth
:int
, 引擎达到的深度。knodes
:int
, 引擎搜索的千节点数。cp
:int
, 位置的 centipawn 评估。如果确定将死,则为None
。mate
:int
, 位置的将死评估。如果不确定将死,则为None
。
数据集创建
- 状态: 正在进行中 (WIP)
数据集使用
- 加载数据集: 使用
datasets
库加载数据集。 python from datasets import load_dataset dset = load_dataset("Lichess/chess-evaluations", split="train")
数据集示例
python { "fen": "2bq1rk1/pr3ppn/1p2p3/7P/2pP1B1P/2P5/PPQ2PB1/R3R1K1 w - -", "line": "g2e4 f7f5 e4b7 c8b7 f2f3 b7f3 e1e6 d8h4 c2h2 h4g4", "depth": 36, "knodes": 206765, "cp": 311, "mate": None }

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
UniMed
UniMed是一个大规模、开源的多模态医学数据集,由穆罕默德·本·扎耶德人工智能大学等机构创建,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理和眼底。数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学图像-文本数据,实现了可扩展的视觉-语言模型(VLM)预训练。UniMed旨在解决医学领域中公开可用的大规模图像-文本数据稀缺的问题,适用于多种医学成像任务,如零样本分类和跨模态泛化。
arXiv 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录