iRights.info-Autor Ilja Braun hat gerade in der SZ einen interessanten Artikel veröffentlicht, in dem er (auch) schildert, warum und wie die VG Wort Geld von Google erhalten möchte. Nun gibt Bill Rosenblatt, einer der besten Auskenner auf dem Gebiet des Digital Rights Management, einen Ausblick auf die Geschäftsmodelle, die mittels Googles Digitalisierunsstrategie möglich werden – und auch, wie Google sich durch seinen Ansatz möglicherweise selbst Konkurrenz schaffen kann.
Denn in der Einigung, die Google mit US-Autoren- und Verlegerverbänden gefunden hat, werden auch einige Geschäftsmodelle der Zukunft beschrieben (IV.7). Einige davon, etwa Zusammenfassungen von Büchern (oder sogar Zusammenstellungen verschiedener Bücher) oder maßgeschneiderte Ausdrucke, können nur funktionieren, wenn die Daten strutkuriert vorliegen, also etwa in einer XML-Struktur. Das geht zum einen nicht mit eingescannten Seiten, die nur als Bilddateien vorliegen. Aber selbst digitalem Text eine entsprechende Struktur zu geben, ist eine Mammutaufgabe, die Google sicher nicht für die Milliarden Seiten leisten kann, die derzeit gescannt werden – und die Digitaliierung soll ja auch erstmal weiter gehen, der Datenbestand also weiter wachsen.
Aber auch die Verlage sind im Moment überhaupt nicht in der Lage, diese Struktur zu liefern, obwohl sie die Daten vorliegen haben. Ich bezweifle sogar, dass es viele deutsche Verlage gibt, die dieses Prinzip überhaupt schon verstanden haben. Selbst wenn sie es haben, ist der Weg zu diesen strukturierten Daten lang und steinig. Und teuer.
Wenn allerdings die Daten in einer XML-Struktur vorliegen, gibt es im Prinzip keinen Grund, es Google allein zu überlassen, damit Geschäfte zu machen. Das können dann auch Konkurrenten. Ob es welche (deutsche?) geben wird, muss sich zeigen.
Außerdem noch der Hinweis auf den großartigen Essay zum Thema „Google und die Zukunft der Bücher“ von Robert Darnton im New York Review of Books.
Matthias,
Vielen Dank für Ihren Pingback. Schön zu sehen, dass Sie die Schwierigkeiten über Struktur und XML gut verstehen. Denn ich vermute dass die Anwälte, die die Einigung verhandelten, verstehen es nicht.
Ich widerspreche der engen Auslegung der Klausel 4.7. Ein (rechtlicher oder technischer) Zwang semantische Technologien zu nutzen ergibt sich aus der Klausel doch gar nicht. Resultat einer „Compilation“ muss weder ein Text mit klassischer Buchstrukturierung sein und noch seine Grenzen aus einer _schwierigen_ semantischen Notation beziehen.
Auch aus technischer Sicht halte ich den Zwang verlagsgenerierte Annotation zu verwenden nicht für gegeben. In Anbetracht des gegenwärtigen Standes der OCR-Technologie und der Tatsache, dass Google zur Zeit wohl die fähigste Datenverwurstungsmaschine ist, wäre es töricht ihnen die Fähigkeit abzusprechen, einfache semantische Merkmale automatisch zu extrahieren. Und dann können sie die genau wie all anderen Daten behalten.
Hallo, „Hans Rosenblatt“, das ist ein berechtigter Einwand, der im Blog von Bill Rosenblatt auch schon gemacht wurde – schauen Sie doch einfach seine ebenfalls interessante Antwort darauf an.
Immateriblog.de - Matthias Spielkamp über Immaterialgüter in der digitalen Welt // Apr 7, 2009 at 10:15 am
[…] machen: Robert Darntons Essay Google and the Future of Books, auf den ich schon vor Monaten hingewiesen hatte, ist nun unter der Überschrift Im Besitz des Wissens in der deutschen Ausgabe der Le Monde […]