話題》AI關出版什麼事?早已打響的智財資源攻防,台灣呢?
近曰據傳有海外機構向台灣收購海量的本土版權書籍,書目規模高達15萬種,交易金額推估近1億台幣(即便不用平均定價計算,折後應該也有5000萬元左右)。面對如此大單,除了說聲恭喜恭喜、替出版方開心之外,其背後仍不免令人浮想聯翩……
關於這件事,有幾個具指向性的現況供大家參考:
- 近年圖像鑑別文字系統突飛猛進,只要有書,無需電子檔、也不用知會任何人,即可輕易轉成數位文本。
- 對AI產業來說,最珍貴、品質也最優的數據,是由專業人士精心撰寫編輯的書籍和文章。
- 目前聊天機器人學習的文本,用圖書館館藏作為比例,已大約是英國第二大圖書館「牛津大學博德利圖書館」自1602年以來累積存量的兩倍。
- AI使用數據的速度比生成數據飛快許多,各科技公司訓練AI的語料來源非常吃緊,最快在2026年,所有高品質數據都將運算完畢——除非獲得更多數據。
- Meta董事長祖克伯(Mark Zuckerberg)曾在該公司內部會議中表示:「那就去非洲找些不太有人管的圖書館一本本掃描,才能讓Meta的AI系統盡快成立。」

➤出版業的黃金誰在挖
圖書館可能是文字轉數位檔案的最大破口。雖無從查證Meta是否真的這麼蠻幹了,但書籍是科技界最迫切需要的優質資料,已是不爭的事實。同時也幾乎可以確認,世上所有的公版內容,應該都已經全部被AI吃下肚。
值得慶幸的是,據說向台灣收購價值上億書籍的單位,是非營利的實驗性學術機構,且採購過程有律師的合約簽證,確保交易和運用方式均為合法。只是話說如此,仍令人難掩焦慮——試想眼前的當下,有個大型語言模型(LLM)正在把台灣所有知識工作者、文化工作者跟創作者的版權作品,一本本照相掃描、數位建檔,一旦進入商用,那後果不堪設想!
在AI產業,LLM訓練一次就耗資200-5000萬美元,幾千萬台幣相對而言真的不算大錢。而台灣目前的版權相關法令,對於再利用的部分毫無規範與限制的能力(只要不是原文照抄都不算違法),因此買方對大批書籍如何運用,我方將難以提出異議。
這是目前我們面臨的最大困境。此事的嚴重性不只出版人必須意識到,也是所有內容產業都應該面對與討論的課題。當科技界眼中最龐大的黃金資源還握在版權方手中,且當前AI應用產品尚未臻成熟之際,應當趁早加以防範、立法、或進行談判。
長期觀察AI演進但不願具名的出版人A即大聲疾呼:「這已經不是箭在弦上的問題!而是對方的箭都已經射向我們了,我們還不趕快將靶畫起來?」
➤AI訓練的材料台灣無法可管
目前全球主要的LLM模型設計公司,包括Meta、Google、Anthropic、OpenAI,4家都是美國公司。去年4月,《紐約時報》一篇〈科技巨頭如何投機取巧,為人工智慧收集訓練資料〉的調查報導指出,2021年底,OpenAI就已面臨文本大水庫見底的危機,該公司因此研發了Whisper語音辨識工具來應對,並將超過100萬小時的YouTube音檔轉錄成文本,用於GPT-4的訓練。從此,也開啟了這些LLM公司的資源搶奪賽,一個個紛紛繞過法律,開後門、走捷徑,對內容產業上下其手。
生成式AI的訓練對內容相關產業造成莫大威脅,不到兩年時間內,全球已有30多起對LLM公司提告的侵權訴訟。但這些科技公司口徑一致,均宣稱:因為AI不會給使用者正確答案,而是從資料庫媒合可能性最高的詞語內容,所以這些訓練語料都是合法使用的。
這個趨勢下,未來影響出版界最大的,將會是技術型書籍。包括商業策略、社會科學等非虛構書籍的商業規模,恐將減少60%以上(如此一來,出版社到底還要不要出書?)。意外的是,虛構類的文學書雖容易被AI複製,但因為風格特色各殊,反而還有存活空間。
綜觀國際,美國的版權相關法案尚未對人工智慧學習有明確管制。日本2019年曾對LLM抱持開放,但2024年中已改回保守限縮。歐盟因10年前改採鄰接權,有法源可對「版權內容再利用」情形納管,咸認是當前面對AI侵權的唯一解。而台灣的版權相關法令與美國相近,對LLM的侵權愛莫能助,且國內對此缺乏維權討論,是目前最大的問題。

➤內容授權的共識
去年4月,英國《金融時報》將新聞資料庫授權給OpenAI,成為繼美聯社、德國斯普林格、法國《世界報》、西班牙普利沙集團後,第5個與之締結的付費協議。許多媒體人將這項計劃視為出賣自己的背叛行為。然而《金融時報》執行長表示,如果當時沒有這麼做,才是更大的災難。達成授權協議,至少能在合理的法律範圍上,互相保護、防止外洩、確保不被其他人利用。

對此做過研究的出版人A表示:「這個觀念在台灣出版界,還是偏少的。」那麼興訟與協議,何者才是維護台灣產業權益較好的解方?他認為,催促政府立即修法保護,有現實上的困難。雖然目前美國參議院已有因應人工智慧時代的版權法修正草案,但台灣若只想等待美國確立後再跟進規範,恐怕為時已晚。
「不過我們還是有機會做一些事的。」他說,版權方此時介入制定規則尚不嫌晚,也絕對有機會達成利己的邏輯模式。
「例如在2024年5月以前,『生成內容若涉及學習資料,需註明出處』這條規則,原本是不存在的,是媒體商與AI公司協議過程中,了解了AI怎麼訓練、資料怎麼被運用之後,才提出來的要求。這表示AI問與答的遊戲規則都還在建立中,也表示台灣現在還來得及、也有條件去跟對方談。樂觀估計,大概一年之內還來得及。」
美國華盛頓大學Emily Benders教授在學術論文裡提到,世界第一大學習語料是英文(AI平台也都以英文為主),而第二大語料是中文,加上全球AI所使用的硬體,有90%都是台灣製造,所以在話語權上,我們絕對有立足點。
有鑑於此,在人工智慧無可逆轉的潮流趨勢下,台灣除了必須盡速訂定符合雙方需求的版權法規,重新規範AI學習這件事情之外,版權擁有者也最好遞出橄欖枝,積極尋求面對面協商。否則一旦技術方優先完成遊戲規則,出版商將不再具影響力與聲量。不僅出版,所有內容產業都應該盡早凝聚出這些共識,面對衝擊時才不會茫然無所知。
➤風口浪尖,出版業想好站哪了嗎?
LLM正在改變世界。過去所有人都認為書籍是整理知識最有系統、最有邏輯,也最容易被吸收的方式(沒有之一),而出版業(包括新聞媒體)最強大的能力即是載體。
可是從去年年中開始,AI已經可以把一切平常人看不懂的論文、學術書,任意生成諸如一齣1.5小時輕鬆幽默好消化的廣播劇,而且不用版權。

當AI將這項功能全數直接下放給用戶使用的時候,就像自媒體發展的歷程一樣,內容將演變成客製化的自助餐,只要掌握好吃的祕訣就有流量,就算是個人也能打趴過去的傳統媒體與出版。
可以想像的是,未來內容提供者可能對接的,不再是出版社,而是「AI知識管理員」。出版商如果沒有在手中仍握有智產優勢的現在,預想及推演跟LLM公司談判的內容,那麼假以時日,「出版」二字將成為過去式,現階段的許多專業,都會變成「過去的傳統工藝」。
出版人A提醒:面對AI,我們不能太過落單,與之攜手還可以成就很多聰明的事,開發更對等的互惠或合作空間。他說,出版人也許會如此自限:「科技公司怎麼可能跟我們談?我們講的他們會聽嗎?我們又管不到他們,也不知道他們要做什麼……」然而,我們又如何確定對方不會聽呢?
我們知道AI很厲害、科技公司賺很多錢,但從未搞懂AI模型長什麼樣、如何被運用。這些都是開啟協商才有機會了解的事,也才有機會提出一些對等條件。除了產業談判,公部門也必須把足夠的專業和力氣放進來協助談判,才比較容易達成目的。
此外,我們只接觸到AI的末端應用,缺乏了解形成原理的人。不管是新聞媒體或出版商,有概念的人屈指可數。或許出版界也需要一些相關專區或專業頻道,認真、定期地檢視AI技術的演進,並廣泛尋找專家,幫我們看看AI語料訓練與版權之間有沒有新的解法,提供一些補品或藥單。
出版人A呼籲:AI的演變超乎我們想像,每個月都在飛速進行,蹉跎十天半個月,我們對它的掌握就會又掉了一大截,當立院還在為法條吵來吵去時,技術早已經翻篇。因此在我們還握有產業優勢與內容資產的當前,跟進的速度真的要加快了。
包括文化部、數發部、立委以及出版話語權較大的人,必須知道事情的嚴重性,開始出手倡議。出版界也要有集體性的討論跟提案,盡速理解AI到底需要我們什麼?我們可以介入什麼?
上車要及時。●
童書短評》#148陪孩子觸碰生命的真實,如流動的河水般想像未來!
●橋上
橋の上で
湯本香樹實(湯本香樹実)著,酒井駒子繪,米雅譯,聯經,380元
推薦原因: 文 圖
適讀年齡:小學高年級、國中(11-15歲)
差一點,小男孩就要縱身一跳,讓自己消失在湧動河水中,幸好一場神秘相遇扭轉了結局,不安的心靈風景隨之豁然開朗。湯本香樹實的故事簡短,字字卻打在心上,毫不迴避直視孩子內心黯然;酒井駒子順應這份矜持深沉,用極其溫柔之筆凝繪明亮,迎來生命之湖的燦美昇華。無力抵擋的時刻、幾乎被吞沒的時刻,請記得讓這本書來到身旁,知道黑暗終將散去,會有人接住自己的憂傷。【內容簡介➤】
●歡喜神奇的黃色巴士
The Yellow Bus
文、圖:羅倫.隆(Loren Long),謝靜雯譯,小宇宙,380元
推薦原因: 文 圖
適讀年齡:學齡前、小學低年級(4-8歲)
黃色巴士無處不往,即使路線換了好幾趟,依然風雨無阻準時出發,從來沒有怨尤遲疑;黃色巴士來者不拒,為孩童流浪漢甚至動物魚群,提供一個安穩的旅程或遮蔽,歡迎所有生命進駐心房。作者用醒目的黃色點燃書頁,賦予這台巴士明亮、無私、溫柔、開放的人物氣質,即使老了舊了,依然化作春泥更護花,創造美好記憶直到最後一刻,善意的循環由此而起,感恩的心情源源不息。【內容簡介➤】
●上學快來不及了!
がっこうにまにあわない
小木屋工坊(The Cabin Company)著,米雅譯,小天下,380元
推薦原因: 文 圖 創
適讀年齡:學齡前(4-6歲)、小學低年級(7-8歲)
讓人腎上腺素飆升、跟著氣喘吁吁的一本奇作。動感圖像把人一秒捲入故事裡,跟著書裡男孩一起迎首衝刺,用發了狂的速度跑向學校,平常無奇的水窪、天橋、火車這時候又偏偏特別怪特別慢,吼,真的要讓人心臟跳出來了啦!13分鐘的奇異路程為何而趕,作者在最後給了一個莞爾卻有說服力的交代,所有的緊繃與焦慮都在那一瞬間解脫了、放鬆了,情緒與畫面的誇張對比讓人看得好滿足、好驚奇。這一路跨越的現實與幻想都是作者理性思考過後的感性爆發,圖像氣焰夠瘋狂、故事節奏夠緊張,把生活小題材做出大器與豪邁。【內容簡介➤】
●十二生肖動物童詩
林世仁著,趙國宗繪,小天下,380元
推薦原因: 知 圖
適讀年齡:學齡前、小學低年級(4-8歲)
十二生肖繪本何其多,這本卻讓人一眼便感受不同。趙國宗老師的插圖雅中帶趣,勁爽線條三兩下便畫出動物們的活力與魅力,每一幅都跳動著活潑開朗的氣息;詩人林世仁也再次展現他深厚的形音義功力,用大量的狀聲、擬人、譬喻介紹動物一一出場,語句雖短卻生動靈活,朗讀起來暢快無比。完美合作帶來精緻成果,讓老題材up up綻放出新意,詩裡畫裡都可見深厚的底蘊與用心。【內容簡介➤】
●這本書是灰色的唷
This Book Is Gray
文、圖:琳賽.華德(Lindsay Ward),黃筱茵譯,遠流,350元
推薦原因: 趣
適讀年齡:小學低、中年級(7-10歲)
灰色想畫一本書,裡頭有灰的天、灰的地、灰狼、灰河馬,沒想到紅黃藍三原色跑出來大聲抗議,黑與白也搖頭說不行,非要把畫面弄得五彩繽紛才罷休,眾顏色大亂鬥,到底誰in誰out呢?謝謝作者獨排眾議,讓總被忽略的灰色在這則故事裡站上C位當主角,一吐怨氣展現自信與實力,小讀者可以透過角色看見自我價值,也重新思考一下對各種色彩的既定感受經驗,刻板少一點,互補多一些,任何顏色都有自己的美麗。【內容簡介➤】
●粉紅不是一種色彩?!
Pink Is Not a Color
文、圖:琳賽.華德(Lindsay Ward),黃筱茵譯,遠流,350元
推薦原因: 趣
適讀年齡:小學低、中年級(7-10歲)
紅黃藍是三原色,橙綠紫是二次色,黑白是無彩色,那麼粉紅色呢?不屬於任何小圈圈也無法參加彩虹七色派對的她,突然強烈懷疑自己是誰、在哪裡、在幹嘛,想著想著都要崩潰啦!讀到這裡,小讀者可別急著心疼抗議,且看作者如何幫助粉紅色解除危機,凸顯與眾不同,找到相知相惜的顏色夥伴。簡單輕薄的一本書,把基礎色彩理論和兒童心理結合巧妙在一起,讀起來輕鬆愉快。【內容簡介➤】
●害羞的小鼴鼠
Mole is not Alone
立川真野(Maya Tatsukaw)著,黃筱茵譯,東方出版社,320元
推薦原因: 趣 文 圖
適讀年齡:小學低、中年級(7-10歲)
小鼴鼠一路上都在苦惱,牠好擔心抵達宴會後交不到朋友、沒有人理牠,好幾次都想著乾脆折返回家算了;好不容易終於來到壽星兔子家門前,一個意外之客扭轉變了牠的最後決定。內向特質的孩子會在這本輕快幽默的故事書裡得到鼓勵與共鳴,藉由小鼴鼠的碎碎念釋放心裡的社恐焦慮,也在故事結局中依偎安放情緒。小鼴鼠雖然害羞卻不寂寞,畫面裡始終中有個與牠相似的身影,地面下地面上,睜大眼睛找找在哪裡!【內容簡介➤】
●昆蟲女孩
THE BUG GIRL
蘇菲亞.史賓塞(Sophia Spencer)、瑪格麗特.麥納瑪拉(Margaret McNamara)著,克哈斯可耶特(Kerascoët)繪,劉淑雯譯,維京,350元
推薦原因: 知 圖
適讀年齡:小學低、中年級(7-10歲)
這本故事緣起作者蘇菲亞.史賓塞的自身經歷,熱愛昆蟲的她曾被同學視為怪胎甚至飽受霸凌,幸賴媽媽的陪伴鼓勵,讓她勇敢拾回天賦與喜好,不再懷疑迷失自己。從自信到失望,從谷底到奮起,幾番情感轉折顯露在清淡色彩與生動構圖裡,不時牽動讀者敏感的心,款款筆觸細膩溫柔,相信很多孩子的心聲也在裡頭被傾聽了、療癒了。【內容簡介➤】
知識性.趣味性.文學性.圖像表現.創意
閱讀通信 vol.352》理想大人的溫柔是……
手指點一下,您支持的每一分錢
都是推動美好閱讀的重要力量