Direktanfrage

Haben Sie Fragen zu diesem Produkt oder wünschen Sie mehr Infomaterial?
Kontakt >
iSquare Spider

Semantische Internetrecherche: iSquare SmartSearch

Was denken Menschen aktuell über ein bestimmtes Thema? Wie erkenne ich frühzeitig Trends? Wer äußert sich wie über mich und meine Produkte?

Diese und ähnliche Fragen stellen sich die Strategen in Unternehmen und Institutionen täglich. Sie nutzen
das Internet als Nachrichtenquelle oder auch als Meinungs- und Stimmungsbarometer. Das kostet viel Zeit, es sei denn, man automatisiert die Recherche.

Textanalyse und Textklassifikation sind hervorragende Mittel zur Informationsgewinnung. iSquare SmartSearch ist das Werkzeug dafür.

Nutzen

  • stets aktuelle, präzise Informationen
  • kurze Recherchezeit
  • Kosteneinsparung
  • individuell anpassbar
  • automatische Suchläufe zu definierten Zeiten
  • übersichtliche Präsentation der Ergebnisse
  • plattformunabhängig
  • Verarbeitung der gängigen Dateiformate

Suche

Die Recherchezeit ist unter Einsatz dieses Softwaresystems gegenüber herkömmlichen, manuell geprägten Textanalysen stark verkürzt. Einmalig definierte Suchprofile können in regelmäßigen Abständen automatisch durchgeführt werden.

Es können unterschiedliche Quellen wie Internet, Intranet, firmeninterne Datenbanken, etc. einbezogen werden.

Bedeutungsbeziehungen zwischen Wörtern sowie Satzzusammenhänge und satzübergreifende Verbindungen werden erfasst. Gesucht wird nach

  • Schlagworten,
  • Wortartmustern,
  • Synonymen mit oder ohne variablen Wortabständen,
  • genauen Wortgruppen,
  • Kombinationen von Wörtern oder
  • Teilwörtern.

Verarbeitung

iSquare SmartSearch verarbeitet permanent alle von einem Web Crawler (z.B. iSquare Spider) übergebenen Texte. Diese werden durchsucht und mit dem Suchprofil entsprechend kategorisiert.

Das semantische Suchprofil ermöglicht es, Zusammenhänge zwischen Schlüsselwörtern zu erkennen. Anhand einer Reihe von Schablonen werden relevante Inhalte identifiziert und klassifiziert. Die Trefferqualität ist hoch, da semantisches Wissen verwendet wird.

iSquare SmartSearch verarbeitet unterschiedliche Dokumenttypen und Formate wie MS Word, PDF, TXT, HTML und XML.

Worthäufigkeitsmessung

Eine Worthäufigkeitsmessung ist integriert. Dabei wird die Quantität von Wörtern in der Nähe von Schlagwörtern erhoben. So können Assoziationen zu den gesuchten Schlagwörtern leichter erkannt werden.

Semantische Verfahren

Bei der Identifizierung relevanter Texte können Mehrdeutigkeiten sicher zugeordnet werden. Es werden unter anderem die folgenden semantischen Verfahren verwendet:

  • Shallow text processing: Analyse von Wörtern und ihrer textlichen Umgebung
  • Stemming: Zurückführung eines Wortes auf seinen Wortstamm,
  • z.B. wird bei der Suche nach "lauf" "laufen, läuft, lief, gelaufen..." gefunden
  • Soundex: Analyse lautgleicher Variationen eines Wortes,
  • so ergibt die Suche nach "Meyer" die Treffer "Meyer, Maier, Mayer..."
  • Fuzzy-matching: unscharfe Suche,
  • die Fehlerzulässigkeit in gesuchten Wörtern lässt z.B. bei der Suche nach dem Wort "Adresse" die Treffer "Adresse, Addresse, Aresse, Adrese, adresse..." zu

Neben dem Auffinden relevanter Texte können in Artikeln und Beiträgen enthaltene neue URLs identifiziert werden. Auf diesem Weg lassen sich bisher unbekannte Webseiten, Foren und Newsgruppen erkennen.

Eine Alarmfunktion liefert Treffer sofort nach ihrer Entdeckung per E-Mail oder SMS aus.

Kategorisierung

Die Bedeutungszusammenfassung ermöglicht den schnellen Zugriff auf gesuchte Informationen. Gerade das automatische Einordnen in Kategorien bringt hier eine erhebliche Zeitersparnis gegenüber herkömmlichen Verfahren.

Überflüssige Treffer werden herausgefiltert, relevante Textanteile herausgeschnitten, thematisch aufbereitet und kategorisiert. So können z.B. alle positiven Bewertungen zu einem Thema zusammengefasst und in Zusammenhang mit einem Ereignis gebracht werden.

Oberfläche

Die iSquare SmartSearch Oberfläche liefert die Sicht auf die in den Dokumenten gefundenen Treffer, geordnet nach Kunden und Kategorien.

Es besteht die Möglichkeit, die Rechercheergebnisse eines oder mehrerer Läufe in verschiedenen Sortierungsarten zu betrachten. Es stehen Listendarstellungen, verschiedene Diagramme und Zeitansichten zur Auswahl.