Was ist Text- und Datamining im Sinne von § 44b UrhG?
Text- und Datamining ist die automatisierte Analyse von digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.
Da das Recht der Vervielfältigung allein beim Urheber oder Rechtsinhaber liegt, wäre es bspw. unmöglich KI zu trainieren. Um diesem Umstand Rechnung zu tragen, erlaubt § 44b UrhG das Text- und Datamining im vorgenannten Sinne. Erlaubt ist in diesem Zusammenhang auch die dazu notwendige Vervielfältigung. So jedenfalls die herrschende Meinung. Höchstrichterlich ist die Frage, ob KI-Training unter Text- und Datamining fällt jedoch noch nicht entschieden.
Das Training einer KI-Anwendungen unter Verwendung von urheberrechtlich geschützten Werken ist nach herrschender Meinung also grundsätzlich ohne entsprechende Lizenzrechte in Deutschland zulässig. Dies allerdings nur, solange der Rechteinhaber dem Text – und Datamining nicht per Opt-Out widerspricht. Nach Abschluss des Trainings müssen die Daten allerdings wieder gelöscht werden.