Nutzen Sie die Expertise von Indoqa und lassen Sie sich Plugins für Apache Solr und Elasticsearch entwickeln, die auf spezifische Anforderungen bei Suche und Indexierung eingehen.
Apache Solr und Elasticsearch erlauben es mit Hilfe von Plugins die Funktionalität an vielen Stellen zu erweitern. Das umfasst u.a. die Verarbeitung von Text und die Art und Weise wie Suchanfragen interpretiert werden.
Ausgangssituation
Bei der Suche nach Gesetzesreferenzen – z.B. § 14 EStG
– stießen wir an die Grenze der Möglichkeiten, der von Apache Solr zur Verfügung gestellten Komponenten zur Textanalyse. Der Grund dafür ist, dass sich die gültigen Varianten, wie eine Gesetzesreferenz aussehen kann, nicht durch syntaktische Regeln vollständig beschreiben lassen.
Lösung
Um dieses Problem zu lösen, entwickelten wir einen Token-Filter
, der zusätzlich zu syntaktischen Regeln auch inhaltliche Regeln zu gültigen Gesetzesnamen und -abkürzungen kennt. Dieser Token-Filter kommt bei der Verarbeitung des Textes und bei der Indexierung zum Einsatz. Er legt zusätzlich eine normalisierte Version einer erkannten Gesetzesreferenz im Index ab. Wird dieselbe Analyse bei der Verarbeitung der Suchanfrage durchlaufen, kommt es zu einer zuverlässigen Erkennung von Gesetzesreferenzen.
Der beschriebene Token-Filter wird als Plugin zur Verfügung gestellt und kann somit in Apache Solr verwendet werden.
Ja, Sie erhalten alle Rechte um das Plugin selbständig (oder in Zusammenarbeit mit Indoqa) weiterentwickeln zu können.
Sie haben die Möglichkeit, das Plugin selbständig weiterzuentwickeln. Gerne unterstützen wir sie auch dabei.
Die zu unterstützenden Versionen werden im Zuge der Beauftragung geklärt. Sowohl Elasticsearch als auch Apache Solr unterstützen seit vielen Jahren die Erweiterung ihrer Funktionalität über Plugins.