Volltextsuche konfigurieren#
sysman sysadmin
Allegra kann Vorgänge und Anhänge nach Text durchsuchen. Unterstützt werden unter anderem PDF, OpenOffice, Word, Excel, PowerPoint, HTML, RTF und XML. Die Volltextsuche muss dafür konfiguriert werden.
Gehen Sie zu Verwaltung > Globale Einstellungen > Volltextsuche,
um die Volltextsuche zu konfigurieren.
Volltextsuche aktivieren/deaktivieren#
Sie können die Volltextsuche aktivieren oder deaktivieren. Beachten Sie, dass die Volltextsuche Speicherplatz benötigt, besonders wenn viele oder große Anhänge indiziert werden. Auch die Rechenlast kann hoch sein, insbesondere wenn beim Systemstart ein vollständiger Neuaufbau des Index erzwungen wird.
Volltextsuche in Anhängen aktivieren/deaktivieren#
Die Indizierung von Anhängen können Sie separat aktivieren oder deaktivieren. Das Deaktivieren ist sinnvoll, wenn nur wenig Speicherplatz verfügbar ist oder die Serverlast reduziert werden soll.
Wir empfehlen, die Indizierung von Anhängen zu aktivieren.
Neu-Indizierung bei Systemstart#
Wenn das Kontrollkästchen für den vollständigen Neuaufbau aktiviert ist, wird der Index beim Systemstart komplett neu erstellt. Dies kann je nach Anzahl der Vorgänge und Anhänge einige Minuten bis mehrere Stunden dauern. Währenddessen steht die Volltextsuche nicht zur Verfügung.
Ein vollständiger Neuaufbau des Index sollte nicht bei jedem Serverstart erfolgen. In der Regel genügt es, den Index etwa halbjährlich neu aufzubauen. Während des Neuaufbaus sollte der Zugriff auf das System möglichst deaktiviert werden.
Analysator wählen#
Allegra verwendet Lucene für Volltextindizierung und Suche. Beim Aufbau des Index ist es sinnvoll, häufige Wörter zu ignorieren, nach denen normalerweise nicht gesucht wird. Dazu gehören im Deutschen zum Beispiel „ein“, „der“, „die“, „das“, „auch“ oder „aber“. Solche Wörter sollten nicht indiziert werden.
Dafür stehen verschiedene Analysatoren zur Verfügung. Sie konzentrieren die Indizierung auf die Textbestandteile, die für die Suche relevant sind. Welcher Analysator geeignet ist, hängt von der Sprache der zu indizierenden Texte ab.
Wählen Sie den Analysator, der am besten zu Ihren Anforderungen passt. Der Standardanalysator ist weniger effizient als ein sprachspezifischer Analysator, funktioniert aber in allen Fällen. Wenn Ihre Texte und Anhänge mehrere Sprachen enthalten, ist der Standardanalysator meist die beste Wahl.
Index Directory#
Standardmäßig wird das Verzeichnis für den Index der Volltextsuche in $ALLEGRA_HOME/index angelegt. Sind die Anhänge in die Volltextsuche mit einbezogen, kann der Platzbedarf schon erheblich werden. Sie geben einen anderen Ort für den Index in der Datei application.properties an:
allegra.index-path=abs-path