Die neue Suchmaschine Clusty

Suchmaschine Clusty

Neue Konkurrenz für Google?


Aktueller Hinweis: Dieser Artikel erschien im Magazin Wissenskapital am 17. August 2004 verfasst (von Dr. William Sen) und befindet sich somit im Digitalwelt-Archiv. Mittlerweile heißt die Suchmaschine Yippy und ist unter der Website yippy.com zu erreichen.


Die besten Erfindungen resultieren manchmal aus purer Frustration. Tippt man einen bestimmten Begriff z. B. bei Google ein, blicken einem meist Tausende Resultate entgegen, die nicht unbedingt mit der Anfrage etwas zu tun haben. Das mag einer von vielen Gründen gewesen sein, warum Raul Valdes Perez sich dazu entschloss eine neue Suchmaschine namens Clusty auf den Markt zu bringen. Mit Erfolg.

Umso mehr Informationen, desto größer das Chaos. Suchmaschinen versuchen seit Jahren der wachsenden Fülle von Informationen Herr zu werden. Sie entwickeln neue Algorithmen und schnellere Server zum Indexieren. Dabei ist die Lage nicht besser als früher: Wo immer man in den öffentlichen Suchmaschinen sucht, Informationen scheinen nicht klar gegliedert zu sein. Volltextsuchmaschinen wie beispielsweise Google verzichten auf eine Kategorisierung. Das hat jedoch einen klaren Nachteil, welches am besten am folgenden Beispiel erkennbar wird: Sucht man nach dem Begriff “Apple” spuckt die Suchmaschine alles aus, was die Begriffe enthält. Der Nutzer muss dann zwischen Macintosh, New York (Big Apple) und Obst mühselig herausfinden, welche Treffer für ihn eigentlich relevant sind.

Auf der einen Seite gibt es die Verzeichnisse, wie zum Beispiel Yahoo oder das Open Directory Project (wir berichteten darüber). Hier werden Webseiten von Redakteuren gepflegt und in bestimmte Kategorien geordnet: Das Resultat ist aber nicht unbedingt ergreifend. Intellektuelle Handarbeit kann die exponentiell wachsenden Datenmengen nicht bewältigen. Obwohl die größte mit Editoren vorangetriebene Suchmaschine ODP eine Satte Summe von 4 Millionen Webseiten ausspuckt, kann sie der Fülle von Milliarden Webseiten nicht standhalten. Das Dilemma ist klar auf der Hand: Qualitativ sortierte Informationen sind nicht quantitativ und quantitative Informationen sind nicht qualitativ verfügbar.

Die Innovation von Valdes-Perez soll das nun ändern. Seine Idee soll beides kombinieren. Eine Suchanfrage nach “Apple” bietet nun auf der linken Spalte dem Anwender die Möglichkeit, seinen Bereich weiter zu differenzieren. Dabei tauchen dann Begriffe auf wie “Fruit”, “Pictures”, “Laptops”, und letztendlich auch “Big Apple” und “New York”. Gleichzeitig kann der Benutzer dann auch sehen, welcher dieser Kategorien, wie viele Treffer aufweisen. Und das Innovative an der Sache: Die Suchmaschine sortiert voll automatisch, ähnlich wie Google.

Mit dieser Technologie möchte Valdes-Perez eine Nische im Suchmaschinenmarkt decken. Die Suchtechnologie kann auch für unternehmensinterne oder auch als Suchalgorithmus für öffentliche Portale genutzt werden. Clusty startete insgesamt mit einer Förderung von US$ 1 Mio. von der National Science Foundation. Zu seinen Kunden gehören mittlerweile NASA und Johnson & Johnson, die die Technologie bereits erfolgreich nutzen. Clusty ist derzeit als Betaversion verfügbar unter: clusty.com.


Die letzten Artikel zum Thema digitale Revolution


Facebook-Skandal Der Facebook-Skandal in meiner Doktorarbeit in 2012

Der Informationswissenschaftler Dr. William Sen hatte die Datenschnittstelle von Facebook bereits in 2012 untersucht und auch einen Zusammenhang zu George Orwells Roman 1984 hergestellt.


Usenet Das Usenet

Über 10 Petabyte an Daten sind in diesem Forum vorhanden und über 100.000 Themen. Kein Forum auf der Welt hat mehr Inhalte als das Usenet.


Geschichte des Usenet Die Geschichte des Usenet

Was war eigentlich das erste Forum der Welt? Die Antwort: Das Usenet – und es ist heute noch online!


Typo3 vs WordPress Typo3 versus WordPress

Open Source CMS wie Typo3 sind kaum noch am Markt bekannt und werden nicht mehr weiterentwickelt. Doch einige Hosts wie Mittwald setzen immer noch auf konservative Open Source Systeme aus bestimmten Gründen.