Факты
Моим клиентом был разработчик модели, создававший модель компьютерного зрения в специализированной вертикали. Контрагентом был архив изображений, владевший правами (на основании лицензий от соответствующих авторов) на корпус примерно из одного миллиона курируемых изображений в этой вертикали. Стороны договорились о коммерческой цене в средне-шестизначном диапазоне за лицензию на обучающее использование. Они не зафиксировали в письменном виде, что такое «обучающее использование», является ли получаемая модель производным произведением, что происходит с обученной моделью, если автор источника отзывает согласие, и может ли лицензиат использовать промпты, содержащие идентификаторы каталога архива.
У каждой стороны было своё неписаное допущение. Архив исходил из того, что для авторов будет действовать opt-out-механизм, который потребует переобучения модели или взвешенного исключения удалённых изображений. Разработчик модели исходил из единовременной лицензии на изображения в том виде, в котором они существовали на момент подписания, без обязательства удаления после подписания. Оба допущения были защитимы при отсутствии исполненной лицензии; ни одно не работало как реальная договорная норма.
Что я сделал
Я составил соглашение о лицензировании данных с нуля совместно с юристом архива. Ключевые условия, отражённые письменно: объём обучающего использования, в том числе допустимость выводов, схожих с лицензированными изображениями; квалификация обученной модели как производного произведения или как самостоятельного произведения, основанного на обучающих данных; многоуровневый механизм удаления по запросу, различающий деидентификацию, взвешенное подавление и полное переобучение, с распределением расходов в зависимости от уровня; раздел заверений и гарантий о цепочке лицензий архива от авторов; пункт о действии после прекращения, описывающий судьбу обученной модели после расторжения.
Также я подготовил side letter, дающий архиву периодическое право аудита, ограниченное записанными входными данными для обучения, под обязательством конфиденциальности.
Результат
Соглашение было заключено по согласованной коммерческой цене с многоуровневым механизмом удаления по запросу, аудиторским side letter и условиями о действии после прекращения, которые согласовали мой клиент и юрист архива. Разработчик обучил модель на лицензированном корпусе, а более поздний запрос об удалении был обработан по уровню деидентификации без полного переобучения. Контрактная архитектура сохранялась при двух последующих продлениях лицензии. Каждое дело зависит от своих фактов; результат здесь не предсказывает результата в аналогично оформленной сделке по лицензированию данных.
Урок
Сделка по лицензированию данных для обучения ИИ - это не лицензия на ПО, не контентная лицензия и не лицензия на сток-изображения. Ей нужна собственная контрактная структура, охватывающая удаление, производный вывод и судьбу обученной модели после прекращения. Стороны, трактующие её как «растянутую» контентную лицензию, оказываются с условиями, не работающими при любой реальной просьбе об удалении. Архитектура договора - это и есть сделка; цена - самая лёгкая часть.
Похожее дело по ИИ или лицензированию данных?
Отправьте контекст сделки и любые черновики условий письменно. Я читаю каждое обращение лично.
См. страницу практики по ИИ и данным Написать на owner@terms.law