Das Landgericht Hamburg (LG Hamburg 27.09.2024, 310 O 227/23) hat in einem interessanten Verfahren zur Erstellung von KI-Trainingsdatensätzen das erstinstanzliche Urteil erlassen (Hintergründe aus Klägersicht u.a. hier und hier). Die Beklagtenvertreterin hat sich bereits dazu geäußert und sieht darin
einen wichtigen Meilenstein für die Forschung im Bereich der generativen Künstlichen Intelligenz dar, da es die die legale Nutzung von urheberrechtlich geschützten Bildern für Trainingsdatensätze wie „LAION 5B“ bestätigt.
Im Kern ging es in diesem Gerichtsverfahren um die Ausnahme für Text- und Data-Mining (kurz „TDM“) in Art 2 Z 2, Art 3, 4 und 7 DSM-RL, welche die im Rahmen des KI-Trainings vorgenommenen Vervielfältigungen unter bestimmten Voraussetzungen gestatten soll. Die TDM-Ausnahme wurde in Deutschland u.a. in § 60d UrhG (Text und Data Mining für Zwecke der wissenschaftlichen Forschung) umgesetzt, in Österreich mit § 42h UrhG.
Ohne Urheberrechtsexperte zu sein, stellt sich mir die Frage, wie weit diese Ausnahme reicht, also was von wissenschaftlicher Forschung (in Österreich: “wissenschaftliche oder künstlerische Forschung”) umfasst ist - eine Frage, die sich übrigens auch unter der DSGVO stellt, siehe hierzu unlängst die deutsche Datenschutzkonferenz zum Begriff der “wissenschaftlichen Forschungszwecke”. Besonders wichtig - und mE nicht abschließend geklärt - ist dabei die (spätere) Überführung in die kommerzielle Verwertung, woran der ursprüngliche Urheber wohl kaum mitpartizipieren wird …
Was lernt man daraus? Wenn man das Scraping auf dem eigenen Webauftritt untersagen möchte, ist die Verwendung einer (maschinenlesbaren) “robots.txt” und am besten auch ein schriftlicher Nutzungsvorbehalt (siehe hier bei Heise im Impressum) erforderlich, mehr dazu (samt Anleitung) u.a. hier und (paywalled) bei Heise (die Artikel-Links sind frei abrufbar) - zwar kein perfekter Schutz, aber immerhin …