亞律國際專利商標聯合事務所

亞律智權雙月刊 Sep 12, 2024

人工智慧生成內容與著作權保護的法律挑戰(上)

文 / 鍾文菁 商標代理人

隨著科技的迅速發展,人工智慧Artificial Intelligence(後稱AI)技術日益普及,特別是在圖文生成領域,AI不斷顯示出極強的創作潛力。然而,這些AI生成的內容,也帶來了著作權法上的挑戰。AI生成的圖文作品應該受到著作權保護嗎?如果應該,那麼保護的範圍和方式又該如何確定?現有的法律框架在面對這些新的技術時,能否有效地保護創作者的權利並促進技術的發展?本文將從AI圖文生成技術的基本原理出發,探討其對傳統著作權法的挑戰、相關的法律案例,以及未來可能的解決方案。

AI 技術的快速發展

近年來AI技術一日千里以驚人的速度快速的發展,這個發展正逐步影響人類的生活及工作方式。AI技術貫穿軟硬體並深入各種產業應用,由數位化升級到AI化,為人類生活與產業帶來重大變革。由於現今數據量的急劇增長、計算能力的提升以及算法的不斷優化加速了AI技術的快速發展。

回顧人工智慧的發展史,最早可以回溯到1946年美國賓州大學(University of Pennsylvania)發表人類第一台電腦ENIAC開始1。在1956年,美國電腦科學家麥卡錫(John  McCarthy)首次使用新詞彙「人工智慧」,並舉辦了第一次人工智慧研討會「達特茅斯會議」(The Dartmouth Workshop),以此為起點,各種人工智慧研究陸續萌芽,科學家們先後著手機器學習、深度學習、資料科學等學問研究2。1997年5月IBM的「深藍」(Deep Blue)擊敗世界西洋棋冠軍卡斯巴洛夫(Garry Kasparov),AI成功吸引所有人的目光。

「深藍」是平行運算的電腦系統,運算能力很強,1997年版本的深藍,運算能力達11.38 gigaflops/秒,每秒可推算2億步棋。2023年全球500大超級電腦由橡樹嶺國家實驗室(ORNL)的「Frontier」奪冠,「Frontier」運算能力達1,194 petaflops/秒,peta是giga的10萬倍,今日超級電腦的運算能力,是深藍的1,000萬倍左右,電腦運算能力進步神速,也成為人工智慧能夠長足進步的重要支柱3

AI圖文生成技術的發展與應用

圖文生成技術的興起源於對自然語言理解和圖像理解能力的不斷提升,同時亦受益於硬體技術的進步和計算能力的提升。AI圖文生成技術的進步依賴於深度學習和大型數據集的運用。深度學習是AI技術中非常重要的一環,深度學習演算法是以人類大腦為模型的神經網路,通過構建多層次的神經網絡模型,逐層提取抽象圖像或文字特徵,讓電腦通過類似基於人工神經網絡的學習方法,從而實現對複雜數據的高效表示和處理。

技術的核心原理通常包括生成對抗網絡(Generative Adversarial Network, GAN)和自然語言處理(Natural Language Processing, NLP)。GAN是一種深度學習模型,其運作原理是由生成器網路(Generator)和鑑別器網路(Discriminator Network)兩個主要組件組成,透過兩者相互對抗產生結果。

GAN的運作原理可以比喻為一場鑑定師與仿畫家的比賽,仿畫家畫出假畫讓鑑定師評斷有多接近真品,根據評斷結果再繼續畫出比原本更好的作品,鑑定師也會透過不斷練習提升鑑定水準,最後比賽的結果就是一幅幾可亂真的機器畫4

自然語言處理(NLP)是透過訓練人工智慧(AI),使其能和人類一樣,完全了解人類語言想表達的涵義。這些技術通過分析大量已存在的數據,學習其中的模式,然後生成新的內容,NLP技術使得電腦能夠理解文字、句法分析、語義分析、生成單詞及短語並進行語法結構模組的建構,以瞭解使用者的意圖或情緒並運用在AI生成的圖文中5。Stable Diffusion和MidJourney等工具就是這樣的技術應用的典型例子,它們通過大量的圖像或文字數據訓練模型,並利用這些模型生成新的視覺藝術作品或文本內容。

這類AI生成技術已被廣泛應用於視覺藝術、音樂、文學等領域。在藝術創作中,AI可以生成逼真的圖像,甚至可以模仿特定藝術家的風格;在文學領域,AI可以根據輸入的提示生成詩歌、小說等文本。然而,這些技術的應用在促進創意產業發展的同時,也引發了關於創意本質的深刻討論:AI生成的內容是否具有原創性?它是否應該被視為「創作」?

著作權保護的傳統框架與AI生成內容的挑戰

傳統著作權法的根本原則在於保護人類創作者的原創性作品。根據國際標準,著作權保護的作品必須是「獨立創作且具備某種創意表現的結果」,並且應由人類創作者創作而成。然而,AI生成內容與人類創作的模式不同,這導致在判定AI生成內容是否享有著作權保護時,出現了難以解決的法律問題。

美國著作權法要求作品必須具備「人類創作」的要素,這意味著完全由AI生成的內容很難獲得著作權保護。而在英國,著作權法則有稍微不同的規定,它允許一些「非人類創作」的作品在特定情況下受到保護,特別是當作品涉及人工生成或電腦生成時。然而,AI生成內容的情況複雜,無論在美國還是英國,這些現行法律框架都面臨著調整的需求。

特別是AI生成內容的原創性問題引發了大量討論。AI生成作品往往是基於大量數據的模仿與重組,而非真正的創意生成。因此,這些作品是否能夠符合法律上對於「原創性」的要求,成為AI生成內容能否受到著作權保護的關鍵。

AI圖文生成技術的法律挑戰——案例分析

在討論AI生成內容的著作權保護時,我們可以參考幾個法律案例,這些案例揭示了AI生成技術所面臨的法律挑戰。

一、2023年初,在美國加州一群專業藝術家對 Midjourney等AI圖像生成軟體開發公司提出全球首宗集體訴訟,主張用以「訓練」AI生成圖像的模型及其後生成圖片的過程均涉嫌侵害著作權(Andersen et al v. Stability AI Ltd. et al )6。首先,Stable Diffusion和MidJourney等AI工具因使用受著作權保護的內容進行模型訓練,成為著作權訴訟的焦點。在這些訴訟中,權利人主張AI系統使用了大量著作權作品進行訓練,而這些作品的使用未經授權,因此構成著作權侵權。AI開發者則主張這些使用符合「合理使用」的法律原則,因為這些作品的使用並未影響原作品的市場價值,且屬於技術創新的一部分。

AI訓練過程中其使用的資料是否有侵害他人著作權?以Stable Diffusion為例,其訓練圖像之主要來源為德國非營利組織開發的LAION-5B圖像集,該圖像集爬取自全球各地的58.5 億高品質圖像數據,圖像來源非常廣泛。這些圖像被用於訓練AI,但其中某些圖像可能是未經授權商業化使用的。Stability AI公司使用這些圖像及其相關的「標籤」進行模型訓練,而使用未取得原創作者授權的圖像進行訓練,即可能引發著作權問題。

首先以LAION-5B圖像集用於Stable Diffusion訓練學習階段,是否涉及「重製」他人著作之行為,應視其技術上如何處理,無法一概而論。著作權保護中所定義之「重製」,係指「以印刷、複印、錄音、錄影、攝影、筆錄或其他方法直接、間接、永久或暫時之重複製作。」可以預期Stability將主張 Stable Diffusion在訓練過程中雖使用LAION-5B子集LAION-Aesthetics中的圖像,但這些圖像未儲存在最終發布的版本中。而訓練過程中的「暫時性重製」屬於美國判例法中被承認的技術操作或中介操作,類似於瀏覽網頁或使用搜尋引擎的行為,並不構成侵權。

二、另一個值得關注的案例是Sancton v. OpenAI Inc.,這是一個針對大型語言模型的訴訟。

2023年的年末,朱利安·桑克頓 (Julian Sancton) 和其他作家向美國紐約南區地方法院對 OpenAI 和微軟提起集體訴訟。原告指控 OpenAI 和微軟使用他們的作品來訓練他們的 ChatGPT AI 語言模型,這些語言模型在訓練過程中使用了大量受著作權保護的文本,侵犯了他們的著作權,並主張OpenAI 和微軟對其作品的使用不屬於合理使用,因為它不具有變革性,同時主張ChatGPT 是一個商業產品,故OpenAI 和微軟對其作品的使用屬於商業性。

OpenAI 和微軟則主張ChatGPT 是對原告作品的合理使用,因為它是創造新意義和表達方式的變革性作品,同時被告並未在市場上替換原告的作品,因此原告沒有遭受任何損失7

該案尚未最終定案,但其結果將對AI生成內容的法律地位產生深遠影響,它將決定AI模型是否可以在沒有獲得著作權授權的情況下,使用他人的作品進行訓練,並生成新的文本或圖像。

三、2023年12月《紐約時報》公司對 OpenAI 及其投資者微軟提出侵犯著作權訴訟。《紐約時報》主張,這些公司未經許可使用了該報紙的數百萬篇文章來訓練其人工智慧模型,其中包括流行的人工智慧平台 ChatGPT 和現在稱為 Copilot 的人工智慧平台。《紐約時報》聲稱,OpenAI 及其由大型語言模型 (LLM) 提供支援的人工智慧模型已經產生了逐字背誦《紐約時報》內容、對其進行仔細總結並模仿其表達風格的輸出,並主張其非法使用《紐約時報》作品創建人工智慧模型侵犯了其著作權,並尋求讓這些公司承擔數十億美元的法定和實際損失8

前述案例仍處於早期階段,並引發了在受著作權保護的資料上訓練人工智慧模型幾個重要的問題,使用受著作權保護的作品來訓練人工智慧模型是否屬於合理使用?Sancton v. OpenAI Inc.案大型語言模型產生之創意內容是否構成著侵權?這樣的使用是否構成合理使用?其訴訟結果也將影響人工智慧技術的未來,以及媒體公司、作者、傳統出版業與人工智慧公司之間的關係如何發展。

如果法院認定 OpenAI 和微軟對原告作品的使用構成著作權侵權,那麼人工智慧開發人員使用受著作權保護的資料來訓練他們的模型可能會更加困難。這可能會扼殺人工智慧領域的創新。另一方面,如果法院認定 OpenAI 和微軟對原告作品的使用屬於合理使用,則OpenAI 和微軟可能會更廣泛地使用受著作權保護的資料來訓練大型語言模型。進而加速新的創新人工智慧產品和服務的開發。

(下期待續)

參考資料

1. https://programmermagazine.github.io/y201410/htm/focus1.html 最後瀏覽日期2024/08/26
2. https://futurecity.cw.com.tw/article/2228 最後瀏覽日期2024/08/26
3. https://blog.csdn.net/weixin_40191861/article/details/131239087 最後瀏覽日期2024/08/27
4. https://aws.amazon.com/tw/what-is/gan/
5. https://bigdatafinance.tw/index.php/tech/methodology/4354-ai-nlp 最後瀏覽日期2024/08/16
6. Case 3:23-cv-00201 Document 1 Filed 01/13/23 Page 1 of 46 
7. https://www.classaction.org/media/sancton-v-openai-inc-et-al.pdf
8. NYT_Complaint_Dec2023.pdf (nytimes.com)

返回上一頁