Wieso man über PhotoSketch nicht besonders skeptisch sein muss

Eine neue Technologie namens PhotoSketch macht derzeit die Runden im Internet. Sie ist sehr beeindruckend: Man skizziert eine Szene, beschriftet die Teile, und das Programm sucht dann automatisch diese Szene in einer Version bestehend aus Fotos aus dem Internet. Manch einer war da aber etwas skeptisch. Da diese Seite keine Kommentare erlaubt, dachte ich mir, ich würde meine Gedanken dazu hier posten.

Der erste angeführte Grund, wieso man skeptisch sein sollte ist, dass es sich um einen gewaltigen Vorsprung in zu großen Bereichen handelt, wie zum Beispiel Bilder anhand der Beschreibung finden, Objekte mit bestimmten Formen darin, diese freizustellen und sie dann zu platzieren. Auf Anhieb wirkt das sicher komisch.

Wenn man sich aber deren Paper durchliest, ist es dass weitaus weniger. Das Bild zu finden ist im Wesentlichen eine Google-Suche (auch wenn Google nicht speziell erwähnt wird), mit einigen Schritten um hinterher falsche Bilder rauszufiltern. Formen erkennen und ausschneiden wird dadurch erleichtert, dass das Programm Bilder wegwirft, die einen zu komplizierten Hintergrund haben. Der Hauptpunkt ist das Zusammensetzen, und dafür haben sie anscheinend auch die meiste Arbeit geleistet. Es ist immer noch beeindruckend, aber nicht mehr so unwahrscheinlich wie auf Anhieb, besonders wenn man bedenkt dass die Forschung doch schon um Längen vor dem ist, was man in Photoshop sieht.

Der zweite Punkt ist, dass diese Entwicklung von völlig unerwarteten Leuten gekommen sei. Das halte ich für prinzipiell falsch. Ja, Firmen wie Google geben sicher viel Geld und Zeit für die Lösung ähnlicher Probleme aus, aber das heißt nicht, dass sie immer bessere Ergebnisse erhalten als Universitäten. Eines meiner Lieblingsbeispiele dafür ist SLAP (Nicht-technische Einführung, PDF-Datei), wobei es sich um etwas handelt, dass sehr ähnlich wie Microsoft Surface ist, aber dazu noch frei positionierbare Knöpfe, Schieberegler, Tastaturen und so weiter bietet, die direkt mit der Tischoberfläche zusammenarbeiten.

In diesem Fall halte ich die Skeptik für nicht besonders sinnvoll.

Geschrieben am 7. Oktober 2009 um 21:47

0 Kommentare

    New comments can no longer be posted because it got to annoying to fight all the spam.