Sphider

einetter® » Glossar » S » Sphider

Sphider

Sphider ist eine Suchmaschine auf Basis der Skriptsprache PHP. Das Haupteinsatzgebiet der Software ist die Erweiterung von Websites um eine Volltext-Suchfunktion, sie kann aber auch für eigene Web-Suchmaschinen verwendet werden. Sphider besteht aus drei Hauptbestandteilen: einem Crawler, der ausgehend von einer beliebigen Website automatisch Verweisen folgt und alle verlinkten Seiten erfasst, einem Indexer, welcher die Texte dieser Websites statistisch auf vorkommende Wörter und Phrasen untersucht und die Ergebnisse in einer Datenbank abspeichert, sowie der Suchfunktion selbst, die über ein Vorlagensystem in eine bestehende Webseite eingebunden wird. Die Software benötigt PHP und MySQL und ist damit auf den meisten Webspaces und Servern mit Standard-Ausstattung lauffähig. Administriert wird das Programm entweder über eine per Browser bedienbare Web-Oberfläche oder von der Kommandozeile aus.

Eigenschaften von Sphider

Der Crawler von Sphider respektiert das verbreitete „robots.txt“-Protokoll. Er findet neben herkömmlichen Verweisen, die sich des HTML-Elements „a“ bedienen, auch Links in Meta-Tags, Frames und JavaScript-Code. Das Crawling kann auf Domains und auf eine bestimmte Tiefe beschränkt werden. Mit zusätzlichen, kostenlos erhältlichen Werkzeugen können neben HTML-Websites auch PDF- und Word-Dokumente durchsucht werden. Crawler und Indexer können automatisch pausiert werden, um den Webserver nicht zu stark zu belasten. Gefundene Seiten können in Kategorien eingeordnet werden, was es ermöglicht, beim Aufruf der Suchfunktion die berücksichtigten Texte auf eine Auswahl zu beschränken. Die Suchfunktion von Sphider versteht logische Verknüpfungen wie AND und OR. Bei englischen Wörtern werden auch Ableitungen des Suchbegriffs, etwa konjugierte Verben, gefunden; ebenfalls erkennt die Software in einigen Fällen Falschschreibungen und schlägt Alternativen vor. Weiterhin können Suchbegriffe ausgeschlossen werden.

Zwei weitere Versionen

Der Hauptautor von Sphider, Ando Saabas, veröffentlichte die erste Version der Suchmaschine im Jahr 2005. Die Originalversion von Sphider ist Open-Source-Software und wird unter der GNU General Public License veröffentlicht. Es existieren zwei Abwandlungen der Software. Sphider Plus bietet erweiterte Features wie ein für Smartphones und Tablets geeignetes Suchformular mit Responsive Design, unterstützt Sprachen mit nichteuropäischen Zeichensätzen – beispielsweise Japanisch – und korrigiert zahlreiche Bugs. Es wird wie das Original als Open-Source-Software vertrieben, beim Download von der offiziellen Webpräsenz wird jedoch eine Spende verlangt. Sphider Pro dagegen ist eine neu programmierte, kostenpflichtige Variante unter einer proprietären Lizenz mit professionellem Support.