Nach dem Urheberstreiks des Unternehmens hinter ‚Claude AI‘, bei welchem bekannt wurde, dass sie riesige Mengen an digitalisierten Büchern illegal zum Trainieren ihres Large Language Models - oder umgangssprachlich KI – genutzt hatten, schlagen die KI-Unternehmen nun mitunter neue Wege ein. Ältere Bücher sind ja noch nicht digitalisiert verfügbar, sondern nur materiell in einer Bücherei oder antiquarisch.
Kalifornien. In den letzten Monaten konnten sich Antiquarinnen und Antiquare höherer Einnahmen erfreuen; viele Bestellungen alter Bücher, oft sogar gleich mehrere auf einmal, was nicht üblich in der Branche ist. Meistens werden antiquarische Bücher von Sammelnden, Galerien oder Museen gekauft, dabei bleibt die Stückzahl oft bei einigen wenigen Büchern. Doch je wärmer die Monate wurden, desto mehr internationale Anfragen von Unternehmen sprudelten auf die gängigen Verkaufsplattformen, wie ZVAB, Amazon, AbeBooks ein. Vorne dabei die kanadische Firma ‚Zoom Books‘. Das im Jahr 2020 gegründete Unternehmen versteht sich als umweltfreundlich; die Bücher, welche sie ankaufen, sollen ein zweites Leben bekommen. Diese hat beispielsweise bei einem Schweizer Antiquar mehrere Bücher bestellt. Die Bücher reichen inhaltlich von dem Kreuzplatz in Zürich, einmal um Hans Arp, ein anderes Mal um bauliche Veränderungen im Bundeshaus oder um eine soziologische Studie über das Verhältnis zwischen der Schweiz und China. Das ist eine ungewöhnliche Bestellkombination, so der Verkäufer. Bücher werden, wenn mehrere gekauft werden, oft thematisch zusammenpassend gekauft. Auch in den Niederlanden berichteten Antiquarinnen und Antiquare von ähnlichen Vorfällen. Ein Händler berichtet von einem E‑Mail-Verkehr mit einem vermeintlich in Sigapur ansässigen Unternehmen, dem ‚2077AI‘, welches mehrere Bücher erkaufen wollte, mit der Begründung, dass das Unternehmen an „einem neuen Projekt teilnehme, das sich auf das Sammeln von Büchern in verschiedenen Sprachen konzentriere, derzeit hauptsächlich auf Englisch“ (vom Englischen ins Deutsche übersetzt). Beigefügt wurde eine Liste, welche 3.000 englischsprachige Titel enthielt, sortiert nach ISBN-Nummer.
Dies sind keine Einzelbeispiele, auch in Deutschland oder Spanien wird von ähnlichen Vorfällen berichtet. Vordergründig fokussiert ‚Zoom Books‘ sich dabei auf Non-Fiction-Büchern ab den 1970ern mit ISBN-Nummer. ‚Zoom Books‘ gibt auf Nachfrage von Journalistinnen und Journalisten keine Antwort, wer ihre Kunden seien. Doch mit Blick auf die derzeitigen KI-Entwicklungen und weitergehend der 2024 eingegangen Klage gegen ‚Anthropic PBC‘ wirft dieser übermäßige Ankauf an älteren Büchern neue Fragen auf.
‚Anthropic PBC‘ ist ein in den USA situiertes Unternehmen, welches vordergründig durch ihr KI-Modell ‚Claude‘ bekannt ist. Im August 2024 wurde es dann im Staat Kalifornien von drei Autorinnen und Autoren auf Urheberrechtsverletzung geklagt. ‚Anthropic PBC‘ hatte durch verschiedene Trainingssets, mitunter ‚the Pile‘, ihre KI ‚Claude’ trainiert. Es ist jedoch öffentlich ersichtlich, dass dieses Trainingsset, bestehend aus über 800 Gigabyte an reinem Buchmaterial aus sogenannten Schattenbibliotheken, also Websites auf denen eingescannte Bücher oftmals kostenlos für den privaten Nutzen heruntergeladen werden können, herangezogen wurde. ‚Anthropic PBC‘ war sich dessen bewusst und hatte somit aktiv das Urheberrecht verletzt. Der Ausgang dieses Unterfangens war eine Zahlung an die Klägerin und Kläger von Seitens ‚Anthropic PBC‘ von 1.5 Milliarden US-Dollar (circa 1.3 Milliarden Euro).
Nun kann sich die Frage gestellt werden, ob ‚Anthropic PBC‘ und womöglich auch andere KI-Unternehmen ihre KIs nun mit legal erworbenem Textmaterial versorgen und trainieren. Vor diesem Hintergrund erscheinen die Anfragen nach mehrere Hundert oder Tausend Büchern von Antiquarinnen und Antiquaren in neuem Licht. Denn diese Bücher können nicht so leicht in die KI-Programme gespeist werden, sie sind auf Papier gedruckt, nicht als .txt-Format vorhanden. Jeder der schon ein Mal ein Buch eingescannt hat, weiß, dass dies kein Unterfangen von einer Minute ist, und weiß auch, dass es passieren kann, dass die Mitte, in welcher die Seiten zusammenführen, etwas schlechter zu lesen sein könnte. Das ist natürlich für die Effizienz nicht gut, weswegen Abhilfe geschaffen werden muss. Indem man das Buch in seine Einzelteile zerlegt und jede Seite mit industriellen Scannern scannt, so kann ein Buch schnell in die digitale Welt gebracht werden. Dass das Buch dabei kaputt geht und in dem Müll landen muss, ist wenn überhaupt nur Nebensache. Diese meist älteren Texte sind für die High-Tech-Riesen deswegen so interessant, da die online zur Verfügung stehenden Inhalte wohl schon fast oder zur Gänze genutzt und in die KI gespeist worden sind. Doch die Profitgier und der Steigerungszwang zu immer vermeidlich Besserem und Effizienterem ist weiterhin vorhanden; somit müssen nun neue Wege gefunden werden. Und diese sind nach amerikanischem Gesetz sogar legal, denn mit einem gekauften Buch kann getan werden, was auch immer die Käuferin oder der Käufer will.
Die Zerstörung von Büchern ist aus der Geschichte immer wieder bekannt, sei es das Niederbrennen der Bibliothek von Alexandria oder auch in dystopischen Romanen ist sie immer wieder Motiv, am wohl bekanntesten dabei das Buch „Fahrenheit 451“ von Ray Bradbury. Wobei nun nicht die Zensur im Vordergrund steht, so ist es doch fraglich, wie weit kulturelles Gesellschaftsgut von einigen wenigen aufgekauft und zerstört werden darf. Während die Unternehmen hinter ‚Claude‘, ‚ChatGPT‘, ‚Gemini‘ und weiteren, diese noch weiter ausbauen können, um ja im Konkurrenzkampf gegen ihre Mitstreiter am meisten Profite schlagen zu können, werden die Second-Hand-Shops und Antiquitätengeschäfte leerer.
Quellen:
watson/NLTimes/Courlistener/Courthouse News


















































































