Bei Internet-Benutzern ist die Wortkreation "googeln" mittlerweile fast schon ein Synonym für Web-Suche geworden. Im Moment ist Googles Vorherrschaft in diesem Bereich wohl kaum in Frage zu stellen. Dafür ist bei der Suche nach Informationen auf Desktop-Rechnern ist ein heißes Rennen entbrannt. Google hat zwar auch hier zeitlich die Nase vorn und sein Produkt bereits fertig, Microsoft hat mittlerweile aber immerhin mit einer Betaversion seines Suchdiensts nachgezogen. Die im Dezember vorgestellte Rechercheleiste lässt sich in das Mail-Programm Outlook, den Explorer und andere Windows-Anwendungen einklinken. Sie sei, so das Unternehmen, viel schneller als bisherige Suchfunktionen. Auch Konkurrent Yahoo hat sich im Dezember erstmals öffentlich zur Desktop-Suche bekannt. Dazu hat das Unternehmen die X1-Software der Hightechschmiede Idealab lizenziert. Diese Angebote der Suchexperten sind für private Kunden gedacht. Ein weiteres spannendes Feld ist die Recherche von Informationen in und für Unternehmen. Auch dieses lässt Google nicht außen vor, sondern versucht, mit so genannten Appliances Fuß zu fassen. Das sind fertig konfigurierte Rechner, auf denen Suchanwendungen laufen, die Unternehmensnetze durchforsten. Bei Kunden aus dem Firmenumfeld will als ganz neuer Player auch IBM punkten
Unsere Stärken sehen wir hier vor allem in der größeren Abdeckung der Back-Ends, also der verschiedenen Datenquellen, die wir suchbar machen können und auch in Bereichen wie Security und einer Suchqualität, also eines Rankings, das ganz speziell auf die Verhältnisse in Intranets mit ihren nicht verlinkten, strukturierten und halbstrukturierten Datenquellen angeht, wo man bei Google doch noch sehr merkt, dass sie aus dem Internet kommen, wo ganz andere Verhältnisse gelten.
So grenzt sich Thomas Hampp von den Technologien des Web-Experten ab. Hampp ist für die Entwicklung der Textanalyse in Omnifind zuständig, das als erste Anwendung seines Unternehmens im Suchumfeld vorgestellt wurde. Doch in diesem Segment ist Google nicht der Hauptplayer, denn deren Technologie beruht vor allem darauf, im Web die Verweise von Seiten aufeinander zu untersuchen. Das funktioniert bei Firmendaten nicht, da diese zum Beispiel als Word- oder Excel-Formate vorliegen und nicht verlinkt sind. Autonomy, Fast und Verity werden von der Gartner Group zu den Technologieführern gezählt. Deren Produkte arbeiten mit unterschiedlichen Verfahren der Textanalyse und werden beispielsweise von Banken eingesetzt, die sich davon einen schnelleren Zugriff auf Kundendaten und Finanzbewegungen versprechen. Lukrativ könnte auch der Einsatz in der Biotechnologie sein, so Hampp:
Wenn man sich im Bereich Life Sciences Module vorstellt, die Gen-Namen erkennen, die Krankheitsnamen erkennen , das kann übergehen in den Bereich der Konkurrenzbeoachtung, des Marketings, wo Produktnamen erkannt werden auf Web-Seiten und suchbar gemacht werden, das kann bis in den Sicherheitsbereich gehen, wo Personennamen im Bereich von Aufklärungsverfahren erkannt werden.
Bei den Geheimdiensten sitzt in den USA und Europa aber Konkurrent Autonomy fest im Sattel. IBM will mit Offenheit punkten und hat deshalb Ende Dezember ein Entwicklungswerkzeug ins Internet gestellt. Auf Basis der bereitgestellten Such-Maschine können Partner Zusatzmodule entwickeln. Das heißt, andere Unternehmen sollen die Entwicklung des Produkts übernehmen. Dabei legt IBM aber nicht den Quellcode offen, sondern nur die Schnittstellen. An diese können Partner Module wie Verzeichnisse mit Fachbegriffen für einzelne Branchen oder Bausteine wie Ontologien anhängen. Ontologien sind Listen, die beispielsweise Begriffe aus bestimmten Berufsfeldern zueinander in Beziehung setzen. Dazu seien gängige Standards aus dem Semantic Web-Umfeld wie das Datenformat RDF und die Ontologiesprache OWL nützlich, aber nicht ausreichend, meint Hampp:
Wir fassen da sehr wohl Semantic-Web-Standards ins Auge, wir haben konkret auch schon Projekte, wo wir für unsere Analysemodule OWL unterstützen, das wird aber wahrscheinlich nicht alles abdecken. Wir sehen gerade im Bereich der Intranets, die durchsucht werden, noch einen großen Bedarf an semantischer Analyse, die auch außerhalb eines Semantic-Web-Standards funktioniert.
Unsere Stärken sehen wir hier vor allem in der größeren Abdeckung der Back-Ends, also der verschiedenen Datenquellen, die wir suchbar machen können und auch in Bereichen wie Security und einer Suchqualität, also eines Rankings, das ganz speziell auf die Verhältnisse in Intranets mit ihren nicht verlinkten, strukturierten und halbstrukturierten Datenquellen angeht, wo man bei Google doch noch sehr merkt, dass sie aus dem Internet kommen, wo ganz andere Verhältnisse gelten.
So grenzt sich Thomas Hampp von den Technologien des Web-Experten ab. Hampp ist für die Entwicklung der Textanalyse in Omnifind zuständig, das als erste Anwendung seines Unternehmens im Suchumfeld vorgestellt wurde. Doch in diesem Segment ist Google nicht der Hauptplayer, denn deren Technologie beruht vor allem darauf, im Web die Verweise von Seiten aufeinander zu untersuchen. Das funktioniert bei Firmendaten nicht, da diese zum Beispiel als Word- oder Excel-Formate vorliegen und nicht verlinkt sind. Autonomy, Fast und Verity werden von der Gartner Group zu den Technologieführern gezählt. Deren Produkte arbeiten mit unterschiedlichen Verfahren der Textanalyse und werden beispielsweise von Banken eingesetzt, die sich davon einen schnelleren Zugriff auf Kundendaten und Finanzbewegungen versprechen. Lukrativ könnte auch der Einsatz in der Biotechnologie sein, so Hampp:
Wenn man sich im Bereich Life Sciences Module vorstellt, die Gen-Namen erkennen, die Krankheitsnamen erkennen , das kann übergehen in den Bereich der Konkurrenzbeoachtung, des Marketings, wo Produktnamen erkannt werden auf Web-Seiten und suchbar gemacht werden, das kann bis in den Sicherheitsbereich gehen, wo Personennamen im Bereich von Aufklärungsverfahren erkannt werden.
Bei den Geheimdiensten sitzt in den USA und Europa aber Konkurrent Autonomy fest im Sattel. IBM will mit Offenheit punkten und hat deshalb Ende Dezember ein Entwicklungswerkzeug ins Internet gestellt. Auf Basis der bereitgestellten Such-Maschine können Partner Zusatzmodule entwickeln. Das heißt, andere Unternehmen sollen die Entwicklung des Produkts übernehmen. Dabei legt IBM aber nicht den Quellcode offen, sondern nur die Schnittstellen. An diese können Partner Module wie Verzeichnisse mit Fachbegriffen für einzelne Branchen oder Bausteine wie Ontologien anhängen. Ontologien sind Listen, die beispielsweise Begriffe aus bestimmten Berufsfeldern zueinander in Beziehung setzen. Dazu seien gängige Standards aus dem Semantic Web-Umfeld wie das Datenformat RDF und die Ontologiesprache OWL nützlich, aber nicht ausreichend, meint Hampp:
Wir fassen da sehr wohl Semantic-Web-Standards ins Auge, wir haben konkret auch schon Projekte, wo wir für unsere Analysemodule OWL unterstützen, das wird aber wahrscheinlich nicht alles abdecken. Wir sehen gerade im Bereich der Intranets, die durchsucht werden, noch einen großen Bedarf an semantischer Analyse, die auch außerhalb eines Semantic-Web-Standards funktioniert.