XPider autom. Search: Fang den (Steuer)Bösewicht
14. Februar 2008 um 09:12 | boss | In Search, Technologie |
Kommentieren
Das Thema Suche in all seinen Ausprägungen beschäftigt uns ja hier im Blog nicht unwesentlich. Dabei ist unsere berufliche Orientierung sicher nicht unwesentlich verantwortlich dafür. Damit aber hier nicht der Eindruck entsteht, dass wir einseitig wären, hier mal etwas von einem eher weninger bekannten Projekt. Eine durch das Deutsche Börse System entwickelte Suchsystem namens Xpider stellt ein automatisiertes System dar, dass selbständig in der Lage ist, Websites und Inhalte bestimmter Typen/Ausrichtung zu scannen und Ergebnisse aufbereitet darzustellen. Die deutsche Steuerfahndung setzt das System seit 2006 als “Zoll-Suchmaschine” um Steuersünder auf die Schliche zu kommen:
“Das XPIDER-System durchsucht das Web nach Unternehmen, die dort geschäftlich tätig und hierzulande steuerpflichtig sind. Die Suchmaschine kann Webseiten automatisiert anhand von vorgegebenen Merkmalen durchforsten, die auf eine unternehmerische Tätigkeit schließen lassen. Das System ist in der Lage, Angebote und Verkäufe aus Online-Verkaufs- und Versteigerungsplattformen anbieterbezogen zu bündeln und entsprechende Anfangsverdachtsmomente zu unterfüttern. “
Es geht also hier nicht um die klassische Form des Suches per Eingabe in einen zentralen Suchschlitz sondern um eine automatisierte Form der Informationsgenerierung und noch wichtiger -verdichtung. Man könnte das als virtuellen Suchagenten bezeichnen. Allerdings äußert sich Wiki hierzu auch etwas vorsichtiger, was die Capabilities angeht:
“Die genaue Funktionsweise von XPIDER ist nicht bekannt. Ein besonderes Merkmal von Xpider ist die Lernfähigkeit. Hierdurch ist es möglich nicht nur automatisiert zu suchen, sondern auch über die Zeit die Relevanz der Suchergebnisse evolutionär zu verbessern. [...] Im November 2006 stellte der Bundesrechnungshof jedoch fest, dass es mit XPIDER “trotz mehrjähriger Datenrecherche” nicht gelang, “wirksam Personen zu identifizieren, die den Finanzbehörden Umsätze und Gewinne aus im Internet angebotenen Waren und Dienstleistungen verschwiegen haben”. Zwar übermittelte XPIDER offenbar massenhaft Daten, aber die Quote der Fälle, die eine genauere Überprüfung rechtfertigten, lag nur im Promillebereich. Und bei keiner dieser Überprüfungen kam etwas heraus. Die gesammelten Daten waren laut Bundesrechnungshof “nicht schlüssig” und dadurch “nicht nutzbar”.”
Trotzdem sicher mal ein spannender und weitreichenderer Ansatz von Suche als uns Endusern von den Jungs auf Mountainview gmein hin suggeriert wird. Manchmal ist das Leben eben doch nicht nur einfach.
via: Glolem.de und Wiki
No Comments yet »
RSS-Feed für Kommentare zu diesem Artikel. TrackBack URI