LIME Dataset|模型解释数据集|可解释人工智能数据集
收藏
- LIME Dataset首次发表于《Why Should I Trust You? Explaining the Predictions of Any Classifier》一文中,由Marco Tulio Ribeiro, Sameer Singh和Carlos Guestrin共同提出。
- LIME Dataset在多个机器学习会议和研讨会上被广泛讨论和应用,特别是在解释复杂模型预测方面。
- LIME Dataset开始被集成到多个开源机器学习库中,如scikit-learn和TensorFlow,进一步推动了其在实际应用中的普及。
- LIME Dataset的研究扩展到更多领域,包括医学诊断、金融风险评估和自然语言处理,展示了其在不同应用场景中的潜力。
- LIME Dataset的相关研究成果被纳入多本机器学习和数据科学教材,成为解释性机器学习的重要工具之一。
- LIME Dataset的改进版本和扩展研究陆续发表,进一步提升了其在模型解释和透明度方面的应用效果。
- 1Why Should I Trust You? Explaining the Predictions of Any ClassifierCarnegie Mellon University · 2016年
- 2Explaining Explanations: An Overview of Interpretability of Machine LearningUniversity of California, Berkeley · 2018年
- 3Interpretable Machine Learning: A Guide for Making Black Box Models ExplainableUniversity of Applied Sciences, Germany · 2019年
- 4A Survey of Methods for Explaining Black Box ModelsUniversity of California, Berkeley · 2018年
- 5Towards A Rigorous Science of Interpretable Machine LearningUniversity of California, Berkeley · 2017年
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
红外谱图数据库
收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。
国家基础学科公共科学数据中心 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录