Автори проти штучного інтелекту: на чийому боці cуд?

December 15, 2023

Ольга Петрів, Олена Спесивцева, юристки напряму “Незалежні медіа” ЦЕДЕМ

Розвиток технологій змушує адаптувати сталі регулювання до сучасних потреб. Традиційне авторське право трансформується разом з розвитком штучного інтелекту. Постають нові питання – хто є автором результатів роботи штучного інтелекту, на чиїх творах штучний інтелект навчається, чи не порушуються при цьому права авторів? Єдиної відповіді немає. Втім, широке поле для дискусій та судова практика стануть основою для заповнення законодавчих прогалин.

Центр демократії та верховенства права вже розповідав про способи дотримуватися авторських прав під час використання штучного інтелекту, про регулювання штучного інтелекту в США та ЄС.

А в цьому матеріалі ми проаналізуємо рішення Федерального суду Каліфорнії по справі Sarah Andersen, et al., v. Stability AI LTD., et al. щодо використання творів авторів платформами для навчання штучного інтелекту та розберемося, як воно може вплинути на пошук балансу між стрімким розвитком штучного інтелекту та захистом авторських прав. 

Спойлер: суд відхилив позови авторів, які звинувачували платформи Stability AI, Midjourney і DeviantArt у використання їхніх творів без згоди, але дав можливість внести додаткові пояснення. 

 

Обставини справи

У січні 2023 року у Федеральному суді Каліфорнії зареєстрували позов художниць Сари Андерсен, Келлі МакКернан і Карли Ортіс до платформ штучного інтелекту (далі – ШІ) Midjourney, DeviantArt та Stability AI. Ці платформи генерують зображення, попередньо навчаючись на базі картинок та зображень, які знаходяться в Інтернеті та усіх відкритих базах. Усі три платформи навчаються на моделі глибокого навчання Stable Diffusion. За допомогою математичного програмного процесу ШІ створює нові зображення, які виникають внаслідок “змішування” навчальних зображень. Більше про принцип роботи Stable Diffusion за посиланням

Художниці звернулися до суду, адже на їхню думку, платформи використовували їхні твори для навчання ШІ, створювали “бази навчальних зображень” та генерували похідні твори без їхньої згоди та без виплати компенсації.

Авторки вимагали компенсацію за завдані збитки через пряме порушення їхніх авторських прав та опосередковане порушення DMCA (Закону про авторське право в цифрову епоху), законодавства про недобросовісну конкуренцію та їхнього права на публічність. 

Позивачки заявляли, що “ШІ, який генерує зображення це інструмент для створення ілюстрацій в 21 столітті, який порушує права мільйонів художників. Необхідно покласти край цьому “кричущому та величезному” порушенню прав до того, як професії художників будуть знищені комп’ютерною програмою, що працює виключно за рахунок їхньої важкої праці”.

Тож перед судом позивачі поставили такі питання (п. 44):

  • Чи порушили відповідачі авторські права позивачок, коли вони завантажували та зберігали копії їхніх творів?
  • Чи порушили відповідачі авторські права позивачок, коли вони використовували копії творів для навчання продуктів ШІ?
  • Чи порушили відповідачі авторські права позивачок, коли вони використовували твори для створення “підробок” (як зазначили позивачки)?
  • Чи порушили відповідачі DMCA інформацію про авторські права (copyright management information), коли видалили її з творів, які використовувалися, та не включили таку інформацію у результати роботи ШІ?
  • Чи порушили відповідачі права позивачок на публічність, коли під час розробки продуктів ШІ використовували запит з проханням згенерувати зображення “у стилі” певних авторів, а саме позивачок?
  • Чи порушуються принципи добросовісної конкуренції та чи повинен cуд заборонити відповідачам “незаконну поведінку”? 

Тоді у січні 2023 року ініційований позов зазнав критики через технічні неточності. Наприклад, у позові стверджується, що ШІ «зберігає стиснуті копії [захищених авторським правом] навчальних зображень», а потім «рекомбінує» їх, функціонуючи як «інструмент колажу 21-го століття» (п. 90). Однак на відміну від простого архіватора, який зберігає конкретні копії зображень, ШІ працює на значно складнішому рівні. Він не зберігає самі зображення, а створює і зберігає математичні моделі (mathematical representations) візерунків, зібраних із цих зображень. Після цього він створює зображення з нуля на основі цих математичних моделей. Тобто кожне зображення є унікальним твором, що базується на абстрактних патернах, вивчених з навчального матеріалу, який отримав ШІ, а не прямим копіюванням або перекомпонуванням існуючих зображень. По суті, це процес створення нового зображення на основі засвоєних алгоритмами моделей і візерунків.

 

Позиція cуду

Суддя відхилив частину позовних вимог за позовом художниць проти компаній Stability AI, Midjourney та DeviantArt, але дав можливість внести додаткові пояснення, усунути технічні недоліки та неточності. 

Наприклад, кожен з відповідачів стверджував, що позови Келлі МакКернан та Карли Ортіс про порушення авторських прав мають бути відхилені, адже художниці не зареєстрували свої зображення в Бюро з авторського права США (U.S. Copyright Office). Суд погодився з аргументами і відхилив позов у частині порушення авторських прав Келлі МакКернан та Карли Ортіс. Адже реєстрація творів є обов’язковою умовою для подання позову про порушення авторських прав. 

У свою чергу cуд продовжить розгляд щодо Сари Андерсен про те, що використання її творів Stability AI для навчання Stable Diffusion можливо порушило її авторські права. Пов’язано це з тим, що Андерсен зареєструвала 16 збірників творів. Відповідачі у свою чергу попросили суд “обмежити” її позовні вимоги про порушення авторських прав саме зареєстрованими збірниками. Також відповідачі стверджували, що недостатньо зі сторони Андерсен заявляти, що вона “створила і володіє авторськими правами на понад двісті творів, включених до навчальних даних” (п. 28). А тому висувати свої звинувачення в порушенні авторського права вона може лише у тому випадку, якщо ідентифікує з точністю кожну з її зареєстрованих робіт, які були використані як навчальні зображення для ШІ. Але Суд вирішив, що така ідентифікація буде більш доречною на наступних етапах справи, а зараз можна презюмувати, що всі роботи Андерсен, які були зареєстровані і знаходилися в Інтернеті, були використані для навчання ШІ.

Суд звернув увагу на технічні неточності позову і зазначив, що у нього треба внести правки. Зокрема, детальніше роз’яснити теорію щодо “стиснутих копій навчальних зображень” та навести конкретні факти того, що Stable Diffusion принаймні частково використовує саме зображення творів, а не їх математичні моделі. Бо поки незрозуміло – чи містить Stable Diffusion лише математичні моделі, які використовуються для створення нових зображень, чи то ШІ пропонує своїм користувачам створювати нові твори, використовуючи “бібліотеку стиснутих творів”. У другому випадку порушення авторських прав є більш очевидним. Адже тоді для генерування нових зображень безпосередньо використовується саме твір автора, а користувачі повинні просити видати результат у стилі конкретного художника. 

Також суд зазначив, що треба більше розкрити поняття “копіювання”. Чи здійснюють платформи ШІ копіювання творів у розумінні Закону про авторське право США? Якщо позивачки в уточненнях доведуть, що дійсно відбулося копіювання їхніх творів, то можна буде говорити про порушення авторських прав. Натомість поки що суду не зрозуміло, чи передбачає процес дифузії (“змішування”) пряме копіювання творів, а не застосування математичних рівнянь і алгоритмів для фіксації ідеї та концепції навчальних зображень.

Проаналізувавши обставини справи, суддя зазначив, що навіть якщо технічні неточності будуть усунені, а позивачі звузять свої вимоги лише до зареєстрованих робіт, він не переконаний, що претензії щодо авторських прав та твердження, що зображення ШІ є похідними від оригінальних творів авторок, можуть “вистояти” за відсутності доказів суттєвої подібності.

Тож аргументи про те, що результати, згенеровані ШІ, є саме похідними від оригінальних творів, а тому є порушенням авторських прав, наразі не є переконливими. Навіть якщо результати ШІ справді засновані на творах, які захищені авторським правом, то позивачки мають надати дуже переконливі докази того, що згенеровані ШІ зображення суттєво подібні на оригінальні твори авторок. Лише в такому випадку будуть існувати підстави для позову про порушення авторських прав. 

Інші претензії, зокрема про те, що платформи порушили DMCA, права авторів на публічність і принципи добросовісної конкуренції, суд відхилив. Суд зазначив, що позивачки не можуть просто стверджувати, що існувало таке порушення, а натомість необхідно конкретно визначити обсяг відповідальності для кожного відповідача та посилатися на переконливі аргументи. 

 

Що далі? 

Проаналізувавши всі обставини справи та наявні докази, cуд вирішив відмовити в задоволенні позовних вимог з можливістю внести правки в позови та виправити недоліки. Це не стосується частини порушення авторських прав за позовом Сари Андерсен до Stability AI та її зареєстрованих творів. Для внесення правок та виправлення недоліків cуд дав 30 днів. 

Рішення cуду може стати знаковим у питанні співвідношення розвитку штучного інтелекту і захисту авторських прав та для формування положень про те, якою мірою платформи ШІ можуть використовувати захищені авторським правом твори в навчальних цілях та як художники можуть захистити себе від порушень авторських прав у зв’язку зі створенням продуктів ШІ. 

Сьогодні стає зрозуміло, що питання потребує більш детального врегулювання, що платформи ШІ будуть намагатися вирішити питання захисту авторських прав, щоб не допустити їх порушення та виникнення спорів. Питання використання творів для навчання ШІ, можливо, буде врегульоване на рівні автор–ШІ або ж на рівні держави чи регіону. Втім, очевидним є те, що традиційне авторське право має трансформуватися.

Наприклад, сьогодні до регулювання авторського права застосовується концепція sui generis (єдиний у своєму роді, винятковий). Це право особливого роду, воно відмінне від “традиційного” регулювання авторських прав. Результати роботи штучного інтелекту потребують унікального підходу до їх регулювання, до обсягу майнових та немайнових прав (які до речі не виникають у роботи ШІ), строку чинності, порядку відчуження прав особливого роду тощо.

У контексті побудови власної судової практики ми можемо звернути увагу на ознаки схожості, наприклад, таких об’єктів інтелектуальної власності, як торгові марки. Відповідно до “Методичних рекомендацій з окремих питань проведення експертизи заявки на знак для товарів і послуг”, торгові марки вважаються схожими за основними трьома ознаками, а саме: графічною, фонетичною та семантичною (змістовою) ознакою. Семантичність у цьому контексті набуває особливого значення, оскільки означає те, на які думки певне зображення може наштовхувати споживача. У процесі порівняння двох зображень вона допомагає оцінити змістове відображення та внутрішнє значення творів. Це може бути вирішальним фактором при аналізі схожості, зокрема в контексті творів, створених за допомогою штучного інтелекту (ШІ). Тобто чи зміст, створений алгоритмами, несе в собі подібні ідеї, теми або асоціації, і чи може це викликати плутанину чи неправильне сприйняття у споживачів.