Hechos
Mi cliente era un desarrollador de modelo que construía un modelo de visión por computadora en un vertical especializado. La contraparte era un archivo de imágenes que tenía los derechos, por licencia de los creadores subyacentes, sobre un corpus de aproximadamente un millón de imágenes curadas en ese vertical. Las partes habían acordado un precio comercial en las mid seis cifras por una licencia de uso para entrenamiento. No habían acordado qué significaba uso para entrenamiento por escrito, si el modelo resultante era una obra derivada, qué pasaba con el modelo entrenado si un creador subyacente retiraba el consentimiento, y si el licenciatario podía usar prompts que nombraran identificadores del catálogo del archivo.
Cada parte tenía una suposición no escrita diferente. El archivo asumía un mecanismo opt-out para creadores subyacentes que requeriría reentrenar o ponderar el modelo alrededor de imágenes eliminadas. El desarrollador del modelo asumía una licencia única sobre las imágenes tal como existían al firmar, sin obligación de eliminación post-firma. Ambas suposiciones eran defendibles en ausencia de una licencia ejecutada; ninguna era operativa como término de acuerdo.
Lo que hice
Redacté el acuerdo de licenciamiento de datos desde cero en colaboración con el consejo del archivo. Los términos centrales abordados por escrito: el alcance del uso para entrenamiento, incluso si las salidas que se parezcan a la imaginería licenciada están permitidas; el tratamiento del modelo entrenado como obra derivada o como obra independiente informada por los datos de entrenamiento; un mecanismo de eliminación a solicitud por niveles que distinguía entre desidentificación, supresión ponderada y reentrenamiento completo, con asignación de costos vinculada al mecanismo aplicado; una sección de declaraciones y garantías sobre la cadena de licencias del archivo desde los creadores subyacentes; y una cláusula de supervivencia que abordaba qué pasaba con el modelo entrenado en la terminación de la licencia.
También redacté una carta complementaria que daba al archivo un derecho periódico de auditoría limitado a inputs de entrenamiento registrados, bajo compromiso de confidencialidad.
Resultado
El acuerdo se ejecutó al precio comercial negociado con el mecanismo de eliminación a solicitud por niveles, la carta complementaria de auditoría y los términos de supervivencia que mi cliente y el consejo del archivo habían negociado. El desarrollador del modelo entrenó contra el corpus licenciado, y una solicitud de eliminación posterior en el término se manejó bajo el nivel de desidentificación sin disparar reentrenamiento completo. El marco contractual se mantuvo a través de dos renovaciones de licencia posteriores. Cada asunto depende de sus hechos; el resultado aquí no predice el resultado en una transacción de licenciamiento de datos con formato similar.
Lección
Una transacción de licenciamiento de datos para entrenamiento de IA no es una licencia de software, ni una licencia de contenido, ni una licencia de stock-image. Requiere su propia estructura contractual que aborde eliminación, salida derivada y tratamiento post-terminación del modelo entrenado. Las partes que lo tratan como una versión estirada de una licencia de contenido terminan con términos que fallan ante cualquier solicitud real de eliminación. La arquitectura del contrato es el acuerdo; el precio es la parte fácil.
¿Tiene un asunto de IA o licenciamiento de datos que se vea similar?
Envíe el contexto del acuerdo y cualquier borrador de términos por escrito. Leo cada consulta yo mismo.
Vea la página de práctica de IA y datos Enviar correo a owner@terms.law