Tras la sentencia del Tribunal Superior de Hamburgo, el caso LAION se ha convertido en una referencia clave para entender cómo aplica la excepción europea de minería de textos y datos (TDM) en el contexto del entrenamiento de modelos de inteligencia artificial. Este procedimiento, iniciado por el fotógrafo alemán Robert Kneschke, plantea cuestiones únicas sobre los derechos de autor, el acceso a datos públicos y los límites del uso científico de contenidos en Internet.
Origen del caso LAION: la demanda de Robert Kneschke
En abril de 2023, Robert Kneschke, fotógrafo, demandó ante el Tribunal Regional de Hamburgo a LAION e.V., asociación alemana sin ánimo de lucro que crea grandes conjuntos de datos (datasets) abiertos (como LAION-5B) utilizados luego para entrenar modelos de IA generativa (p. ej., Stable Diffusion), por presunto uso ilícito de una de sus creaciones desde la agencia de stock (Bigstock) a través de la cual la comercializaba.
LAION es acrónimo de Large-scale Artificial Intelligence Open Network. Se trata de una entidad que pretende desarrollar y publicar en abierto código, modelos de aprendizaje automático y conjuntos de datos, de manera que estén disponibles y sean reutilizables por terceros sin necesidad de entrenar sus modelos desde cero, promoviendo un uso eficiente de la energía y consumiendo menos recursos. Las imágenes del dataset LAION-5B se obtenían, entre otros, de un conjunto estadounidense (Common Crawl) que contenía también su descripción en texto, con el fin de comprobar que las mismas correspondían con su contenido visible.
Argumentos de las partes y marco de la excepción TDM
En su demanda, Kneschke argumentaba que se había utilizado una imagen de su autoría no solo sin su autorización, sino incluso contra su prohibición expresa de scraping, hecha en ejercicio de su derecho a excluir (opt-out) toda operativa de la excepción de minería de textos y datos (TDM, por sus siglas en inglés: text and data mining). Argumentó que la inclusión en el dataset permitiría a una IA generar otras imágenes a partir de la suya, perjudicando el valor comercial de su obra y afectando a sus derechos de explotación. Solicitó la eliminación de la imagen del conjunto de datos, compensación por el uso no autorizado de la misma y que LAION se abstuviera de repetir la conducta.
Cabe aclarar que la excepción de TDM (arts. 2.2, 3 y 4 de la Directiva 2019/790, sobre derechos de autor y afines en el mercado único digital, DDAMUD) supone un límite a los derechos de exclusiva de propiedad intelectual (en particular, reproducción) que permite a terceros recopiladores de datos y textos digitales, si se cumplen los requisitos legalmente establecidos, copiarlos sin necesidad de autorización previa de sus titulares, con el fin de analizarlos y generar informaciones nuevas que incluyan, sin carácter exhaustivo, pautas, tendencias o correlaciones. Cuando la TDM se hace con fines comerciales, el legislador permite que los titulares de derechos se opongan a dicha utilización (opt-out), es decir, impidan la operativa de dicha limitación o excepción a sus derechos de exclusiva.
LAION se defendió proclamando la legalidad del acceso a la imagen (era públicamente accesible en el sitio web en el que se encontraba, disponible para cualquiera y sin medidas técnicas de protección), señalando que ni descargaba ni conservaba imágenes en su dataset, sino que solo había accedido a los metadatos asociados, que, junto con la dirección del sitio y la descripción en texto de la imagen, era lo único que conservaba o se incluía en el dataset. No había, argumentaba, ni reproducción propiamente dicha (ni descargaba ni conservaba) ni comunicación pública de la obra. Además, su actividad encajaba en la excepción de TDM del art. 4 de la Directiva , dada la finalidad científica y de investigación de su dataset y ser una entidad sin ánimo de lucro. El presunto opt-out del autor, por lo tanto, no habría de considerarse operativo, no solo por la finalidad del uso de la imagen por su parte (entidad in ánimo de lucro dedicada a la investigación que recopilaba datos con fines científicos), sino también por no haberlo ejercido de forma que la máquina pudiera leerlo.
Primera instancia: sentencia del Landgericht Hamburg (2024)
El 27 de septiembre de 2024, el Landgericht de Hamburgo dictaba sentencia (Landgericht Hamburg, Sentencia de 27 de septiembre de 2024, nº 310 O 227/23), dando la razón a la demanda. En esta primera instancia, el Tribunal alemán concluyó que, efectivamente, el uso hecho (comparar la imagen con su descripción textual y así valorar la correlación entre ambos) era lícito al amparo de la excepción de TDM de la Directiva europea (art. 3) y su trasposición alemana (§ 60d UrhG, Urheberrechtsgesetz, Ley de Propiedad Intelectual germana), dado que no había fines comerciales y se actuó en interés público, con fines científicos (párrafo 110 y ss.). Ciertamente, del dataset de LAION podrían aprovecharse entidades que sí tuvieran ánimo de lucro, pero como en la creación del mismo ninguna de ellas ejerció una influencia determinante (incluso aunque hubieran donado fondos a la entidad) ni tenían acceso preferencial (era de acceso general y gratuito), la actividad de la demandada resultaba ser lícita. El opt out solo es posible frente a prácticas de TDM comercial (art. 4 DDAMUD y § 44b UrhG), no científico por parte de entidades sin ánimo de lucro (art. 3 DDAMUD y § 60d UrhG). Ver otros casos judiciales sobre IA y derechos de autor
Aunque el tribunal falló a favor de LAION basándose en la excepción de TDM con fines científicos, se pronunció “de paso” (obiter dictum) sobre la manera en que los autores o titulares de derechos podían oponerse a la excepción general de TDM (la comercial), interpretando las normas de forma abierta y pro titulares: bastaba, a su juicio, un aviso de reserva de derechos en “lenguaje natural” («natürlicher Sprache»), legible por humanos, por cuanto, dado el estado de la técnica, la tecnología de IA moderna es también capaz de comprenderlo («maschinenverständlich»; al menos, sí cuando se dicta la sentencia, aunque deja la puerta abierta a que no lo fuera en 2021, cuando se incluyó la imagen en el dataset; vid. párrafos 102-108). Recurrió incluso al RIA, cuyo art. 53 obliga a los proveedores de IA a usar tecnologías de vanguardia para respetar los derechos de autor (párrafo 103).
Recurso y sentencia del Tribunal Superior de Hamburgo (2025)
La sentencia de esta primera instancia fue recurrida por el demandante ante el Tribunal Superior Regional (Oberlandesgericht) de Hamburgo, alegando que el tribunal de instancia había aplicado erróneamente la excepción de TDM (la actividad de LAION no era propiamente científica, sino de creación de un dataset masivo para entrenar modelos de IA, no para extraer patrones de investigación, y permanentemente reutilizable incluso para fines comerciales, habiendo incluso una finalidad económica indirecta); había habido, a su juicio, reproducción plena de la obra, no un mero análisis de la misma, con un opt-out válido deliberadamente ignorado por la demandada, por lo que esta no había tenido un acceso lícito a la obra. Quedaba así violado también el derecho moral del autor, en lo referente a la forma o contexto de explotación de su obra.
LAION, por su parte, mantuvo la operativa de la excepción de TDM con pleno encaje en § 60d UrhG (insistió en la finalidad científica, no económica ni directa ni indirectamente, y que ella propiamente no entrenaba modelos ni vendía el dataset, al que daba acceso público y gratuito: lo que hicieran con él terceros que lo utilizaran no es controlable ni influye en la aplicación de la excepción de TDM); además, señaló que toda posible reproducción fue meramente técnica y transitoria, a partir de un acceso lícito, y que el opt-out no era válido al no ser legible por la máquina.
El recurso fue resuelto por el Oberlandesgericht de Hamburgo en su Sentencia de 10 de diciembre de 2025 (Az. 5 U 104/24), que no solo ratifica la ratio decidendi del tribunal inferior(el argumento principal en torno a que se trataba de una TDM lícita por ser con finalidad científica), sino que hasta enmienda a este, a favor de la demandada, en lo relativo al ejercicio del opt-out, recogiendo un criterio mucho más estricto: en todo caso, para que este pueda ser válido cuando pueda ejercitarse, ha de hacerse en lenguaje que entienda la máquina, no en lenguaje natural.
En primer lugar, el Tribunal Superior valida la argumentación de la sentencia recurrida en lo tocante a la aplicabilidad de la excepción de TDM, al estar en el contexto en que esta es plenamente operativa: es indiferente de dónde tome los datos o que el dataset se utilice después, o no, para el entrenamiento de una IA (pág. 13). Se trata de una visión amplia y funcional de la excepción, que, en tanto se cumpla con el objetivo de establecer correlaciones o inferencias, cubre los actos preparatorios o previos a un eventual uso de las informaciones así obtenidas para el posterior entrenamiento de una IA. Al conservar el dataset solo los enlaces, la reproducción de la imagen efectuada, en aplicación de la “regla de los tres pasos” (págs. 21 y ss.), se considera un simple paso técnico intermedio, temporal, pues no afecta a la normal explotación de la obra, los posibles usos futuros por parte de una IA generativa son especulativos y la excepción que la ampara, la TDM, es equilibrada, merced al mecanismo de opt-out. Aunque, ciertamente, este no opera en este caso, por tratarse de una entidad sin fin de lucro (aunque se financie por donaciones), con una finalidad científica, no comercial, que ofrece su conjunto de datos al público en general de forma libre y gratuita. Lo que hay que analizar para para que opere la excepción de TDM contenida en el § 60d UrhG, frente a la cual no cabe oponerse (no es posible el opt-out), dice el Tribunal, es si la organización dedicada a la investigación que hace la minería persigue o no fines comerciales, no si la investigación beneficia también a terceros con fines comerciales (pág. 31). El hecho de que esos terceros hayan realizado donaciones a la entidad, tengan acceso anticipado o pueda hasta haber solapamientos de personas entre entidades (colaboración público-privada) no implica la existencia de una “influencia decisiva” en la labor de minería realizada que impida el funcionamiento de la excepción del § 60d UrhG (art. 3 DDAMUD).
Opt-out legible por máquina y situación procesal actual
El Tribunal Superior, sin embargo, enmienda la interpretación de instancia en cuanto a la forma de ejercitar el opt-out, exigiendo que esta se realice no en lenguaje natural, sino en forma que lo entienda la máquina. Pudiera sorprender aquí la profundidad de su análisis, toda vez que, reconducido el caso a la aplicación de la excepción de TDM por parte de una entidad sin ánimo de lucro con fines de investigación frente a la cual no cabe oponerse, pudiera resultar ya innecesario el argumento o haber ratificado sin más el del tribunal inferior. Es, sin embargo, la diferente opinión que tiene la Sala frente a la sentencia anterior en este punto la que la lleva a desarrollarlo.
Para el Tribunal Superior, no basta con que el texto en lenguaje humano pudiera ser técnicamente legible por la máquina. El opt-out debiera ejercitarse de forma que pueda implementarse funcionalmente en el flujo automatizado de la minería. Aunque tanto el legislador europeo como el alemán dejan la puerta abierta a la utilización de distintos medios para hacer la reserva de derechos, que podría así constar en las condiciones generales o los términos de uso del sitio, es necesario que aun en tales sitios sean legibles por la máquina. Es por ello que el mero recurso al lenguaje natural no basta, pues podría resultar ilegible para la IA (así, en 2021, en que la tecnología no estaba tan avanzada ni estaban generalizados los “modelos grandes de lenguaje” o LLM como ChatGPT, pero incluso en la actualidad), dado que el lenguaje humano puede ser interpretable (lo que impide el automatismo de la exclusión) Es por ello que el Tribunal considera que lo adecuado es recurrir a mecanismos estandarizados, verificables y documentados, que se integren en el flujo automático de operación de la máquina cuando realiza la minería (metadatos y/o protocolos universales o extendidos, tipo el archivo “robots.txt”): “en cuanto a la cuestión de la legibilidad por máquina, no solo importa que el texto pueda ser capturado por una máquina, sino que también pueda ser interpretado por ella en el sentido de que, mediante un procedimiento automatizado, se pueda garantizar que los contenidos cubiertos por la reserva no se procesen” (pág. 19).El caso no está cerrado. El Tribunal concluye concediendo acceso a la casación ante el Tribunal Federal (Bundesgerichtshof, el Tribunal Supremo alemán), dada la importancia del tema y la ausencia de jurisprudencia sobre la interpretación de los § 44b y 60d UrhG en relación con el uso de obras protegidas en las etapas preliminares del entrenamiento de la inteligencia artificial.

