five

Opentapioca Entity Linker Resources (Solr, Opentapioca Configsets)

收藏
DataCite Commons2026-03-13 更新2026-05-03 收录
下载链接:
https://data.goettingen-research-online.de/citation?persistentId=doi:10.25625/YMYM0R
下载链接
链接失效反馈
官方服务:
资源简介:
These resources are needed for the MONAPipe <code>opentapioca_entity_linker</code> (Solr container).<br><br>Solr configsets and pre-indexed Wikidata collection for use with the modified <a href="https://github.com/wetneb/opentapioca">OpenTapioca</a> (v0.1.2).<br><br><b>Licensing:</b><ul><li><code>opentapioca/</code> (Solr configsets): Apache-2.0 — derived from <a href="https://github.com/wetneb/opentapioca">OpenTapioca</a> by Antonin Delpeuch</li><li><code>wikidata_20241216_all_shard1_replica_n1/</code> (Wikidata index): based on <a href="https://www.wikidata.org">Wikidata</a> data, licensed under <a href="https://creativecommons.org/publicdomain/zero/1.0/">CC0 1.0</a></li></ul><b>Modifications by Pia Schwarz (IDS Mannheim) and Florian Barth (Georg-August-Universität Göttingen):</b><ul><li><code>opentapioca/configsets/tapioca/conf/solrconfig.xml</code>: Updated lib paths from contrib/ to modules/, replaced LRUCache/FastLRUCache with CaffeineCache, updated XSLTResponseWriter class path for Solr 9.x</li></ul>See the API dataset (<a href="https://doi.org/10.25625/9OBIVL">doi:10.25625/9OBIVL</a>) for full modification details.

本数据集资源为MONAPipe的<code>opentapioca_entity_linker</code>(Solr容器)所依赖。<br><br>包含适配修改版<a href="https://github.com/wetneb/opentapioca">OpenTapioca</a>(v0.1.2)的Solr配置集与预索引维基数据(Wikidata)数据集。<br><br><b>授权协议:</b><ul><li><code>opentapioca/</code>(Solr配置集):采用Apache-2.0协议——源自Antonin Delpeuch维护的<a href="https://github.com/wetneb/opentapioca">OpenTapioca</a>项目</li><li><code>wikidata_20241216_all_shard1_replica_n1/</code>(维基数据索引):基于<a href="https://www.wikidata.org">维基数据(Wikidata)</a>数据集,采用<a href="https://creativecommons.org/publicdomain/zero/1.0/">CC0 1.0</a>协议授权</li></ul><b>由IDS曼海姆分校的Pia Schwarz与哥廷根乔治-奥古斯特大学的Florian Barth所做的修改:</b><ul><li><code>opentapioca/configsets/tapioca/conf/solrconfig.xml</code>:将库路径从contrib/更新至modules/,将最近最少使用缓存(LRUCache)/快速最近最少使用缓存(FastLRUCache)替换为Caffeine缓存(CaffeineCache),并针对Solr 9.x版本更新了XSLT响应编写器(XSLTResponseWriter)的类路径</li></ul>完整修改细节请参阅API数据集<a href="https://doi.org/10.25625/9OBIVL">doi:10.25625/9OBIVL</a>。
提供机构:
GRO.data
创建时间:
2026-02-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作