Indemanda ng Encyclopedia Britannica ang OpenAI Dahil sa 'Memorization' ng ChatGPT

Sa isang mahalagang ligal na hakbang, ang Encyclopedia Britannica at Merriam-Webster ay nagsampa ng kaso laban sa OpenAI. Sinasabi ng mga publisher na ang ChatGPT ay sinanay sa kanilang naka-copyright na nilalaman nang walang pahintulot. Ang pangunahing akusasyon ay ang AI ay "kabisado" ang kanilang materyal, na naglalabas ng mga halos verbatim na kopya.

Ang kasong ito ay tumatak sa gitna ng generative AI debate: ang paggamit ng naka-copyright na data para sa pagsasanay. Ang kinalabasan ay maaaring magtakda ng isang pangunahing precedent para sa kung paano pinagmumulan ng impormasyon ng mga kumpanya ng AI. Itinatampok nito ang lumalaking tensyon sa pagitan ng mga tagalikha ng nilalaman at mga developer ng AI.

Ang Mga Pangunahing Paratang: Paglabag sa Copyright at Pagsasanay sa AI

Ang demanda, na unang iniulat ng Reuters, ay nagpapakita ng direktang hamon sa mga kasanayan ng OpenAI. Sinasabi ng Britannica na paulit-ulit na kinopya ang proprietary content nito at ginamit para sanayin ang mga modelo, kabilang ang GPT-4. Ito, ayon sa kanila, ay bumubuo ng malinaw na paglabag sa copyright.

Ang OpenAI ay hindi pa naglalabas ng pormal na pampublikong tugon sa partikular na paghahain na ito. Karaniwang sinasabi ng kumpanya na iginagalang nito ang mga karapatan ng mga tagalikha ng nilalaman at gumagamit ng malawak na hanay ng data. Gayunpaman, ang mga publisher ay lalong humihingi ng kabayaran at kontrol.

Ano ang Kahulugan ng "Memorization" sa AI?

Sa terminolohiya ng AI, ang "memorization" ay tumutukoy sa isang modelong nagre-reproduce ng data ng pagsasanay na may mataas na katapatan. Para sa ChatGPT, nangangahulugan ito na maaari itong mag-output ng mga sipi mula sa Britannica na halos kapareho sa orihinal. Sinasabi ng demanda na ito ay nangyayari "on demand."

Ito ay naiiba sa isang modelo ng pag-aaral ng mga konsepto o katotohanan. Ito ay tungkol sa verbatim replication ng protektadong expression. Sinasabi ng mga publisher na ang mga ito ay hindi awtorisadong mga kopya na direktang ginagamit sa proseso ng pagsasanay, hindi lamang mga inspiradong output.

Ang Mas Malawak na Legal na Labanan para sa AI at Nilalaman

Ang demanda na ito ay hindi isang nakahiwalay na kaganapan. Bahagi ito ng lumalaking alon ng paglilitis mula sa mga publisher, may-akda, at artist. Ang pangunahing tanong ay kung ang paggamit ng mga naka-copyright na gawa upang sanayin ang AI ay bumubuo ng patas na paggamit o nangangailangan ng paglilisensya.

Malaki ang epekto ng resulta sa buong industriya ng AI. Ang isang desisyon laban sa OpenAI ay maaaring pilitin ang mga kumpanya na i-audit ang data ng pagsasanay nang maingat at secure ang mga mahal na lisensya. Ito ay maaaring makapagpabagal ng pag-unlad at mapataas ang mga gastos sa pagpapatakbo.

Kumokonekta rin ito sa mas malalaking pagbabago sa industriya, tulad ng paglipat patungo sa mga ahente ng pamimili ng AI na nakahanda na baguhin ang lahat sa e-commerce. Ang data na nagpapakain sa mga ahenteng ito ay nasa ilalim ng katulad na pagsisiyasat.

Pangunahing Implikasyon para sa Mga Publisher at AI Developer

Itinatampok ng kaso ang ilang kritikal na isyu para sa magkabilang panig:

Pagkilala sa Halaga: Gusto ng mga publisher na kilalanin na ang kanilang na-curate na content ay may likas na halaga para sa pagsasanay sa AI. Mga Modelo sa Paglilisensya: Maaaring kailanganin ng industriya ang mga bagong framework para sa mga kumpanya ng AI na maglisensya ng content sa sukat. Mga Teknikal na Pag-iingat: Maaaring kailanganin ng mga developer na magpatupad ng mas mahuhusay na mga filter upang maiwasan ang verbatim na output ng naka-copyright na materyal. Transparency: Mayroong lumalaking panawagan para sa mga kumpanya ng AI na magbunyag ng higit pa tungkol sa kanilang mga pinagmumulan ng data ng pagsasanay.

Mga Precedent at Kinabukasan ng Generative AI

Ang mga nakaraang kaso ay nagbunga ng magkahalong resulta, na ginagawang kritikal na punto ng panonood ang demanda na ito. Ang doktrina ng "patas na paggamit" ay sinusubok sa mga hindi pa nagagawang paraan. Dapat balansehin ng mga korte ang pagbabago sa proteksyon ng mga karapatan sa intelektwal na ari-arian.

Ang legal na kawalan ng katiyakan na ito ay nakakaapekto sa pagpaplano ng negosyo sa buong teknolohiya. Kung paanong naghahanda ang mga kumpanya para sa mga madiskarteng pagbabago at potensyal na tanggalan sa isang pabagu-bagong merkado, ang mga kumpanya ng AI ay dapat mag-navigate sa legal na tanawin na ito.

Ang resolusyon ay maaaring humantong sa ilang mga senaryo sa hinaharap:

Mga Licensing Ecosystem: Mga malawakang deal sa pagitan ng mga kumpanya ng AI at mga aggregator ng nilalaman. Pagtaas ng Synthetic Data: Tumaas na pamumuhunan sa pagbuo ng orihinal, walang copyright na data ng pagsasanay. Regulatory Action: Mga bagong batas na partikular na namamahala sa data ng pagsasanay sa AI at copyright.

Bakit Mahalaga ang Kasong Ito sa Lahat

Ito ay hindi lamang isang hindi pagkakaunawaan sa korporasyon. Nakakaapekto ito sa kalidad at pagiging maaasahan ng mga tool ng AI na ginagamit namin araw-araw. Kung ang mga modelo ng AI ay hindi matuto mula sa mataas na kalidad, na-verify na mga mapagkukunan, ang kanilang mga output ay maaaring maging mas tumpak.

Itinataas din nito ang mga tanong na etikal tungkol sa pagkakakitaan mula sa hindi nabayarang malikhain at intelektwal na paggawa. Itinutulak ng demanda ang isang mas napapanatiling modelo kung saan ang mga tagalikha ay mga kasosyo sa AI revolution, hindi lamang mga mapagkukunan ng data.

Konklusyon: Isang Defining Moment para sa AI Ethics and Law

Ang demanda ng Encyclopedia Britannica laban sa OpenAI ay nagmamarka ng isang tiyak na sandali. Huhubog ito kung paano binuo at kinokontrol ang generative AI para sa mga darating na taon. Ang balanse sa pagitan ng pagbabago athindi kailanman naging mas mahalaga ang proteksyon sa copyright.

Habang umuunlad ang mga teknolohiyang ito, ang pananatiling may kaalaman ay susi. Para sa higit pang mga insight sa kung paano umaangkop ang mga nangungunang kumpanya sa mabilis na pagbabago ng tech, mula sa AI hanggang sa mga natatanging mobile application, galugarin ang higit pang pagsusuri sa Seemless.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free