Gezielte Suche nach Informationen im WWW (Tobias Tschöp)
Weil im Internet die verfügbaren Informationen nirgends zentral verzeichnet sind, kommt es bei der gezielten Suche nach Informationen im WWW vor allem darauf an, sog. Suchmaschinen effektiv zu nutzen. Suchmaschinen sind an das Internet angeschlossene Computer, die das Netz nach Informationen durchkämmen und z. B. in einer Datenbank verzeichnen, die dann von den Benutzern mit Hilfe von Schlagwörtern durchsucht werden kann. Die zahlreichen, heute zur Verfügung stehenden Suchmaschinen, bereits mehr als 100 an der Zahl, werden dabei danach unterschieden, was mit ihnen überhaupt gefunden werden kann. Drei wichtige Kategorien sind hier:
2. Die Suche nach Dokumenten im WWW
2.1
Unterschiede zwischen den Suchmaschinen
Die Suchmaschinen für das Auffinden von WWW-Dokumenten unterscheiden sich hinsichtlich einer Vielzahl von Merkmalen: Beispielsweise variiert die Anzahl der verzeichneten Dokumente zum Teil beträchtlich, und auch die Abfrageflexibilität reicht von der Möglichkeit einer einfachen Schlagwortsuche bis hin zu einer komplexen Suche, bei der mit logischen Verknüpfungen der Suchworte gearbeitet werden kann.
Viele weitere Unterschiede zwischen den einzelnen Suchmaschinen kommen hinzu. Die folgende Tabelle soll das am Beispiel von Suchmaschinen in Deutschland veranschaulichen:
Tabelle 1: Suchmaschinen in Deutschland
|
|
|
Merkmale: |
|
|
|
---|---|---|---|---|---|---|
Suchmaschine: |
E-Mail-Adresse |
Anzahl der verzeichneten Dokumente |
Abfragemöglichkeit |
Aufbau der Datenbank |
Index |
Trunkierung |
Aladin |
|
Stichwortbasiert |
Volltextdatenbank |
Nein |
Nein |
|
DINO |
|
Logische Verknüpfung der Suchbegriffe möglich |
Keine Volltextsuche |
Ja |
Ja |
|
Flipper |
Ca. 167000 Dokumente |
Logische Verknüpfung der Suchbegriffe möglich |
Volltextdatenbank |
|
Ja |
|
Lycos.de |
2 Mio. deutsche und 60 Mio. internationale Einträge |
|
|
|
|
Neben den hier vorgestellten und vernachlässigten Suchmaschinen in Deutschland gibt es natürlich noch eine Vielzahl von internationalen Suchmaschinen; die größten und schnellsten gibt es dabei in den USA.
2.2 Internationale Suchmaschinen
2.2.1 Alta Vista (http://altavista.digital.com)
Alta Vista verzeichnet z. B, mehr als 31 Millionen WWW-Einträge, wobei die Suchworte mit den logischen Operatoren And, Or, Near und Not verknüpft werden können. Außerdem ist Alta Vista eine Volltextdatenbank, in der der komplette Text der WWW-Seiten verzeichnet ist. Möglich ist hier sogar die Übergabe ganzer Textpassagen. Unterstützt werden schließlich auch Trunkierungen. Folgendes Beispiel soll nun einige der genannten Aspekte verdeutlichen: Wenn man sich etwa für Museen in Mönchengladbach interessiert, kann man in das Abfragefeld +Museen +Moenchengladbach eingeben und erhält ... Treffer.
Angenommen jemand geht nun diesen Treffern durch reale Museenbesuche in Mönchengladbach nach und beschließt daraufhin frustriert, sich fortan für alle möglichen Museen, aber nicht mehr für die in Mönchengladbach zu interessieren, könnte er den Eintrag +Museen Moenchengladbach in das Abfragefeld eingeben. Angesichts der ... Treffer wird er sich dann wohl noch frustrierter fühlen. Damit soll gesagt werden, daß Alta Vista besonders für klügere Abfragen geeignet ist, denn der Not-Operator kann ja im Gegensatz zum vorherigen Beispiel eigentlich sehr gut zur Informationsreduktion eingesetzt werden. Es ist ja unmittelbar ersichtlich, daß der Eintrag +Depression wesentlich mehr Treffer ergeben wird als der Eintrag +Depression Ängstlichkeit.
2.2.2 Lycos (http://www.lycos.com)
Eine zweite sehr bekannte internationale Suchmaschine ist Lycos, die mit 90 % aller Seiten einen sehr umfangreichen Satz an Verweisen auf WWW-Dokumente verzeichnet. Zu einfache Suchabfragen führen deshalb auch zu tausenden von Verweisen. Jacobs (1996) hat z. B. nach dem Begriff intelligence gesucht und erst ab Rangplätzen weit der Zehntausender-Marke Treffer zur menschlichen Intelligenz gefunden. Deshalb gilt auch hier, von den Möglichkeiten zur komplexen Verknüpfung der Suchbegriffe über logische Operatoren Gebrauch zu machen.
2.2.3 Yahoo (http://www.yahoo.com/)
Als drittes Beispiel bietet auch Yahoo die Möglichkeit, komplexe Suchabfragen an die Datenbank zu richten. Daneben wird aber zusätzlich ein hierarchisch strukturierter Index angeboten, der ausschließlich manuell geprüfte Verweise enthält. So ergibt sich ein System verschachtelter Rubriken, die man in Anlehnung an das Branchenverzeichnis Yellow Pages nennt. Die Yellow Pages von Yahoo enthalten dabei einige Hundert Links zu Psychology, die sogar noch in sinnvolle thematische Untergruppen aufgeteilt sind.
2.2.4 Meta Tools
Meta Tools sind schließlich Suchmaschinen, die Stichworte an andere Suchmaschinen weitergeben. Dann werden die Ergebnisse eingesammelt und Redundanzen eliminiert, was dem Benutzer in einer neu erstellten Prioritätenliste zurückgemeldet wird. Weil solche Meta Tools wie etwa der MetaCrawler (http://metacrawler.cs.washington.edu:8080/) stets mehrere Suchmaschinen durchsuchen und daher viel Zeit in Anspruch nehmen, empfiehlt sich eine solche Simultansuche wohl nur bei sehr speziellen Suchen oder wenn man mit mehreren Suchmaschinen nicht zum gewünschten Ergebnis gelangt ist.
3. Die Suche nach Dateien und Software
Zur Suche nach Software oder speziellen Dateien eignet sich insbesondere Lycos, da diese Suchmaschine nicht nur WWW-Seiten, sondern beispielsweise auch den Inhalt von FTP-Servern. Ein FTP-Server ist ein an das Internet angeschlossener Rechner mit oft tausenden von Dateien. Von öffentlich zugänglichen, sog. Anonymen FTP-Servern können nun Dokumente oder Computerprogramme auf den lokalen PC übertragen werden.
Ein spezielles Suchprogramm, um Software zu finden, die über solche anonymen FTP-Server angeboten wird, ist Archie. Der Benutzer muß lediglich den Dateinamen des gesuchten Programms oder auch nur ein kleines Fragment davon an Archie übergeben und erhält dann neben einer Liste von FTP-Servern, von denen das Programm geladen werden kann, auch Angaben zum Verzeichnis, in dem die Datei auf dem Server abgelegt wurde, sowie Informationen über Datum und Größe der Datei.
Der Zugang zu Archie ist dabei über viele Wege möglich. Beispielsweise gibt es spezielle Archieprogramme für den eigenen Computer, komfortabel ist aber auch der Zugang über das WWW, etwa über den von der Technischen Hochschule Darmstadt bereitgestellten WWW-Zugang:
http://www.th-darmstadt.de/archie/archieplex.html
Beachten sollte man dabei allerdings immer, daß nur die Wahl eines geografisch möglichst nahen Servers minimale Übertragungszeiten erreicht werden können. Wenn die Dateinamen für eine Suche mit Archie nicht zur Verfügung stehen, kann es außerdem nötig werden, diese zunächst mit herkömmlichen Suchmaschinen in Erfahrung zu bringen, z. B. indem man nach der Herstellerfirma, nach dem Programmnamen oder nach dem Namen des Autors sucht. Speziell psychologische Software ist darüber hinaus in den Datenbanken SIByl und COMPSYCH verzeichnet.
Wieder zeigt sich auch hier, daß generell gilt, die verschiedenen Suchsysteme möglichst geschickt miteinander zu kombinieren, um bei Suchen erfolgreich zu sein.
4. Die Suche nach einer E-Mail-Adresse
Weltweit gibt es etwa 40 Millionen E-Mail-teilnehmer, die nirgendwo zentral verzeichnet sind. Diese Lücke versuchen derzeit Anbieter sog. White Pages, d.h. elektronischer E-Mail-Bücher, zu schließen. Einige White Pages werden nun im folgenden vorgestellt:
Der Server suchen.de (http://www.suchen.de) verzeichnet in erster Linie E-Mail-Adressen von privaten T-Online-Benutzern, wobei unklar ist, wieviele Adressen dort überhaupt verzeichnet sind.
Four11/LockUP (http://www.four11.com/) führt bereits über 7 Millionen E-Mail-Adressen. Daneben werden aber z. B. auch persönliche Homepages verzeichnet. Außerdem versorgt Four11 auch Yahoo mit der Option People Search, so daß sich Suchabfragen hier auf eine Reihe verschiedener Parameter wieetwa Name, ort oder Zugehörigkeit zu einer Bildungseinrichtung beziehen können.
Internet Address Finder (http://www.iaf.net/) enthält etwa 5 Millionen Einträge. Hier werden nicht nur E-Mail-Adressen gefunden, sondern man erhält umgekehrt auch Informationen zu Personen, von denen man nur die E-Mail-Adresse hat. Weitere Vorzüge sind neben der Schnelligkeit des Systems vor allem, daß zur Suchabfrage Angaben wie Vorname, Ort und Organisation übergeben werden können, und daß auch Trunkierungen unterstützt werden.
WEDWorld E-Mail Directory (http://worldemail.com/wede4.shtml) greift auf 12 Millionen E-Mail-Adressen, 140 Millionen Unternehmensadressen und zahlreiche Telefonnummern zu. Die Suchfunktionen sind sehr gut und erlauben die Eingabe von Namen (Personen, Unternehmen, Organisationen), von Teilen einer E-Mail-Adresse, von Postleitzahlen oder auch von Bruchstücken einer Telefonnummer.
5. Ausblick
Nachdem nun exemplarisch vorgestellt worden ist, was man im Internet alles suchen kann, soll jetzt abschließend noch einmal betont werden, daß gerade die Kombination der verschiedenen Suchsysteme wichtig ist, um alltägliche wissenschaftliche Aufgabenstellungen schnell zu bewältigen:
Beispielsweise liefert die Suche nach einer psychometrischen Skala zur Erfassung generalisierter Selbstwirksamkeit auf das Schlagwort Self-efficacy zahlreiche WWW-Seiten zurück, die gewünschte Information fehlt aber. Die Suchmaschine Lycos jedoch verzeichnet auch den Inhalt von Gopher-Servern (Gopher: menügesteuerter Internetdienst und Vorläufer des WWW). Jetzt muß man nur noch wissen, daß Gopher eine Testdatenbank enthält, und in der Tat ergibt hier eine Abfrage über 20 verschiedene Verfahren, von denen zumindest drei die Möglichkeit zur Erfassung allgemeiner Selbstwirksamkeit bieten. Nun könnte man noch die E-Mail-Adressen der entsprechenden Autoren suchen und diese dann per Mail um die Zusendung von Informationen bitten. Als das dauert weniger als ..., während man auf herkömmlichen Wege vielleicht nach Tagen feststellen muß, daß man immer noch im Trüben fischt.