Internetrecherche

Recherchieren in Zeiten von Google geht schnell:
Einige Suchwörter eingegeben und Sie haben stets etliche relevante Ergebnisse

Nur: Was bekommen Sie, wenn Sie schnell zufrieden sind?

Die Fähigkeit, eine Recherche fachgerecht durchzuführen und zu den relevanten Ergebnissen zu kommen, wird Informationskompetenz genannt. Diese beinhaltet, neben zielorientierten Strategien, die Klärung zentraler Begriffe und ein Verständnis der zugrundeliegenden Technologien. Was will ich wissen? Was sind Suchmaschinen und Kataloge? Was sind Schlagwörter?

Sie sollten sich über einige grundsätzliche Gegebenheiten des World Wide Web im Klaren sein bzw. informieren, ohne die Informationskompetenz nicht denkbar ist. Die Suche per Suchmaschine durchsucht nicht das gesamte Internet, sondern lediglich den Index eben dieser Suchmaschine. Welche Logische Syntax verwenden die großen Suchmaschinen? Wie weit werden die Bool‘eschen Logik und die Structured Query Language (SQL) - durch die großen Suchmaschinen unterstützt? Wir klären gängige Missverständnisse, nicht nur bei der Suche mit Google.

Was ist ist das Internet und wie groß es? Was sind SurfaceWeb, DeepWeb und Darknet? Wie interagieren sie und in welchen Größenverhältnissen stehen sie zueinander? Einigermaßen sicher scheint der Schätzwert von gegenwärtig etwa 100 Millionen Websites zu sein. Wenn durchschnittliche Website aus 1000 Webseiten mit je 100 Kilobyte bestehen würde, dann wäre das Internet 11 Petabyte groß.

Informationssuche oder Informationskompetenz?

Der Pagerank Algorhithmus: Ein Bild für die Recherche

Wir bieten Ihnen mit unserem Seminar Internetrecherche mehr als Verweise auf ergiebige Quellen. Wir versetzen Sie in die Lage mit Verständnis für den Aufbau, die Struktur und die zugrundeliegende Technologien des Internets selbst erfolgreich auf die Suche nach den Perlen im WWW-Misthaufen zu gehen. Darüber hinaus bieten wir natürlich auch praktische Tipps für die systematische Suche und beantworten Ihre Fragen.

Lernziele

Nach diesem Seminar werden Sie folgendes können:

  • Mit Begriffen von zentraler Bedeutung wie Internet Protokoll (IP), DNS-Server (DNS), Hypertext Markup Language und Textanalyse sowie Structured Query Language (SQL) vertraut sein
  • Die Gliederung des Internets in die Bereiche des Surface-, Deep-, Private- und Darknet verstehen
  • Für die jeweilige Fragestellung geeignete Suchinstrumente einsetzen
  • Die beiden grundsätzlichen Ansätze zur Erschließung des Internets, nämlich seine manuelle Erfassung über Top-Down strukturierte Portale und Verzeichnisse sowie die automatisierte Erfassung durch die Crawler/Bots/Spider der Suchmaschinen verstehen (Bottom-Up) und deren jeweilige Grenzen einschätzen
  • Die Priorisierung der Suchergebnisse durch Google unter besonderer Berücksichtigung des Pagerank verstehen
  • Die faktische Relevanz von Suchergebnissen mittels Prüfmuster schnell auf Plausibilität prüfen
  • Induktive und deduktive Suchstrategien für Verzeichnisse/Kataloge und Suchmaschinen entwickeln
  • Eine Suchmatrix für die Recherche einsetzen
  • Ansatzpunkte für die Suche im Deep- und Social-Web finden
  • Bei der Suche mit Synonymen, Akronymen und fremdsprachlichen Begriffen arbeiten
  • Seminar

    Seminar Internetrecherche Kompakt
    (Drei Tage)

    Grundlagen

    Was ist das World Wide Web?

    Opaque Web - Private Web - Proprietary Web - Invisible Web Website - Webseite - Homepage - Hypertext - Hypertext Markup Language - Sprungmarken - Universal Ressource Locator - Adressierung - Typen von Suchinstrumenten - Portale - Suchmaschinen - Indizes - Bits, Roboter, Agenten und Crawler - Darknet - TOR - Transport Layer Security (TLS) - Fachdatenbanken und Portale

    Grundlegende Technologie

    Grundlegen Begriffserklärungen im Internet

    Website - Webseite - Homepage - Hypertext - Hypertext Markup Language - Sprungmarken - Universal Ressource Locator - Adressierung - Typen von Suchinstrumenten - Portale - Suchmaschinen - Indizes - Bits, Roboter, Agenten und Crawler

    Adressierung

    Grundlegen Begriffserklärungen im >Internet

    Numerische Rechner-Adressen - IP-Header - Interne IP-Adressen - Externe IP-Adressen.

    DNS-Domänennamespace

    Hierarchischer Verzeichnisdienst, der den Namensraum des Internets verwaltet

    Domain Name System (DNS)- Hierarchisches Namenskonzept: www.Secondlevel-Domain.Toplevel-Domain - Zentrale Namensauflösung/ DNS-Server -  Hierarchischer Verzeichnisdienst, der den Namensraum des Internets verwaltet

    Hypertext Markup Language

    Grundlegen Begriffserklärungen im >Internet

    HTML - HTML5 - URL-Adressenaufbau und Dateiformate

    Hyperlinks

    Verbindungen durch Hyperlinks und Sprungmarken

    Interne Links - externe Links - Links mit Sonderfunktionen (Email, PDF)

    Suchinstrumente

    Kataloge sind altertümliche, aber wichtige Suchinstrumente

    Typen:
    Portale (Verzeichnisse, Kataloge) - Open Directory Project - Gateways zu Datenbanken - Beschränkungen - Zugang zu internationalen Daten - Horizontale Portale - Vertikale Portale - Register und Thesauri - Social Bookmarkdienste - Merkmale von Suchmaschinen

    Maschinelle Textanalyse

    Grundlegen Begriffserklärungen im >Internet

    Grundlage der Ermittlung von Relevanz - Hierarchie der Begriffe bei Volltextsuchmaschinen - Stichwörter - Schlagwörter - Textanalyse - Häufigkeit des/der Suchbegriffe - Positionierung - Formatierung

    Indexe

    .

    Funktionsweise - Automatischen Indexierung - Volltextindizierung - Stoppwörter - Computerlinguistik - Indexierungskonsistenz - Bots, Agenten, Spider und Crawler „Harte“ und "Weiche" Suchwörter

     

    Structured Query Language

    Grundlegen Begriffserklärungen im >Internet

    SQL-Schnittstelle - (DML) Befehle zur Datenmanipulation - (DDL) Befehle zur Definition des Datenbankschemas - (DCL) Befehle für die Rechteverwaltung und Transaktionskontrolle - (DRL) Befehle für die Datenabfrage - Boole‘sche Operatoren: Und - Oder - Nicht - Near - Google Advanced Search - Phrasensuche - Joker - Begriffsrelation - Werkzeug: Verknüpfungen - Phrasen - Joker und Wildcards - Boole‘sche Operatoren - Ergebnismengen - Proximity search - Stopworte - +Stopwort - “depreciated operators” - Einsatz von () zur Hierarchisierung von Abfragebestandteilen

    Top 100 Websites nach Traffic

    (aus Sicht der USA)

    Wo Finden?

    Wie und wo was finden

    Schneller Einstieg? - Gründliche Recherche? - Medienformen

    Historie der Suchmaschinen

    Die Geschichte der Suchmaschinen beginnt mit Gopher

    Gopher 1990 - WebCrawler 1994 - AltaVista 1995-2013 - Persönliche Suchmaschinen: SPHIDER - Google Custom Search Engine Benutzerdefinierte Suche

     

    Typen von Suchinstrumenten

    .

    Portale (Verzeichnisse, Kataloge) - Open Directory Project - Gateways zu Datenbanken - Beschränkungen - Zugang zu internationalen Daten - Horizontale Portale - Vertikale Portale - Register und Thesauri - Social Bookmarkdienste - Merkmale von Suchmaschinen

    Web, Bot, Datenbank und User

    .

    GET zu URL - Antwort extrahieren - Weiterführende URL's extrahieren

    Mehr

    Grundsätzliche Suchstrategien

    Ziel - Fragestellung – Suchmethoden - Suchinstrumente - Suchrichtungen - Methoden - Filtern - Newsgruppen und Mailinglisten - Bookmark Verzeichnis - Strategien nach Definition eines sehr speziellen Begriffes - Schreibweise und Akronyme - Sprachliche Variationen - Unerwünschte Begriffe ausgrenzen - Spezifizierung mit verwandten Begriffen - Zielorientierung - An-recherchieren - Vergleichen - Was fehlt? - Indirekte Suchanfragen (Invisible Content)

    Datenbank Strategien

    .

    Ranking

    Ergebnisranking

    Volltextsuchmaschinen - Ranking - Automatischen Indexierung - Volltextindexierung - Stoppwörter, Deskriptoren - Termgewichtung, Indexierungskonsistenz - Faktoren - Stichworte - HTML- Strukturinformationen (HTML-Tags) - Meta-Tags - Dateigröße, Änderungsdatum - eingebettete Elemente - Index: Aktualisierung