『您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態』

跳到主要內容區塊

工業技術研究院

:::

工業技術與資訊月刊

395期2025年05月號

出版日期:2025/05/15

正方形 Icon 觀念探索 Insights & Trends

AI人工智慧助攻創意大躍進

撰文/海文(Will Douglas Heaven)  翻譯/連育德

本刊取得美國麻省理工學院Technology Review期刊圖文授權。
本刊取得美國麻省理工學院Technology Review期刊圖文授權。

忘掉一鍵式創意吧!這些藝術家與音樂人不願把創作交給AI代勞,轉而尋找AI的新用途,為創作過程注入更多阻力、挑戰與驚喜。


葳爾森(Lizzie Wilson)有時會帶著人工智慧(AI)跟班現身銳舞派對。

今年2月平日的這天晚上,葳爾森來到倫敦東區的一處閣樓空間,天花板不高,她把筆電接到投影機,螢幕畫面投影在牆上。室內泛著粉紅光暈,一小群人隨意走動。葳爾森坐下來,開始寫程式。

現場音響砰然響起電音,一下子喀喀不停,一下子咻咻作響。大家隨著節奏點頭,看她在牆面螢幕上打出一行又一行的程式碼,有時調整聲音、有時疊加節拍,有時出錯了還會做個鬼臉。

葳爾森是一名即時程式撰寫表演者(Live Coder)。相較於大多數電音製作人使用專業軟體,這些表演者當場直接撰寫程式碼,即時創作音樂,這種即興演出稱為「算法銳舞」(Algorave)。

「看表演時,如果只是有人在舞台上操作筆電,其實滿無聊的。」她說:「音樂是好聽,但就是少了表演的氛圍。現場寫程式不一樣,大家看得到我輸入什麼,而且每次筆電當機,觀眾反而很嗨,還會大聲歡呼。」

敢於冒險,正是這種表演的精神。也因為如此,葳爾森喜歡加碼演出,讓生成式AI模型自行創作出節拍與循環,她隨著即興發揮。葳爾森稱這套模型是「即時程式撰寫代理人」,會提出讓她意想不到的聲音組合。「結果偶爾會有驚喜。」她說:「這時放手演出就對了。」

葳爾森目前是倫敦藝術大學(University of the Arts London)創意運算學院(Creative Computing Institute)的研究人員,跟許多人一樣投入「人機共創」(Co-creativity),亦即不由人類單獨創作,而透過AI來激發或批判創作過程,有助於做出人類無法獨力完成的作品。她和同事打造出即時程式撰寫代理人,希望探索如何以AI協助人類的藝術創作,例如她個人的音樂即興演出。

這個願景遠遠超越了OpenAI、Google DeepMind等公司的現有產品。他們的生成式工具固然能自動完成各式各樣的創意任務,讓人立刻產生滿足感,但我們要付出什麼代價?有些藝術家與研究人員擔心,AI技術可能讓我們被動吸收更多七拼八湊的內容。

正因為如此,他們正在設法讓創作過程多一點「人味」,目標要研發出能夠擴增、而非剝奪人類創意的AI工具,激勵我們在創作音樂、開發遊戲、研發玩具等眾多領域做得更好,同時為人機共創的未來奠下基礎。

最終,生成式模型可望為藝術家與設計師帶來全新的媒介,推動他們製作出以前能力尚不可及的成品,讓人人都能擁有創作超能力。

創意大爆發

創意雖然沒有固定形式,但人人都有發揮創意的時刻。我們的創作從迷因到藝術傑作,從幼兒塗鴉到工業設計,包羅萬象。成年人普遍有一種錯誤觀念,覺得創意會隨著年紀增加而消失,但不管是下廚、在浴室高歌,還是製作無厘頭的TikTok短片,大多數人還是懂得發揮創意,樂在其中。創意不必是高尚藝術,也不必撼動世界(當然也可以)。創意是基本的人類行為,值得被讚頌與鼓勵。

先前Midjourney、OpenAI的DALL-E、開源的高人氣Stable Diffusion陸續推出文字轉圖像生成式模型,彷彿帶來一場創意大爆發。只要點一下,數百萬人便能創作任何一種圖像,風格任選,成品令人驚艷。文字轉影片的模型後來跟著登場。如今,像Udio這類新創公司正在研發類似的音樂創作工具。創作的果實如此唾手可得,對許多人都是第一次。

但看在許多研究人員與藝術家的眼中,這些工具雖然掀起熱潮,卻扭曲了「創意」的真諦。「如果我請AI創作,那不是我在發揮創意。」在馬里蘭州陶森大學(Towson University)研究人機共創的瑞茲瓦娜(Jeba Rezwana)說:「互動只有一次:點一下就生成一個東西,如此而已,沒辦法說你喜歡這個部分,但想改那個地方。無法進行你一來我一往的對話。」

瑞茲瓦娜所說的,正是目前多數生成式模型的運作邏輯。你可以給予回饋,要求AI工具再生成一次,但每次新的結果都是從頭開始生成,因此有時很難百分之百達到你想要的效果。電影製片人伍德曼(Walter Woodman)主持的藝術團體「害羞孩子」(Shy Kids),去年首次使用OpenAI的文字轉影片模型製作短片,但他看到成品後說:「Sora就像吃角子老虎,生成結果完全碰運氣。」

此外,有些生成式工具推出最新版本後,預設情況甚至不依照使用者的指令生成圖像或影片。指令送到模型前,會由軟體先行編輯,通常會加入數十個隱藏詞彙,讓生成的圖像提升精緻度。

「這些工具會加油添醋,讓成果更吸睛。」在倫敦國王學院(King,s College London)的研究運算創意的庫克(Mike Cook)說:「你叫Midjourney畫一張醜醜的圖,它還辦不到哩!」這些工具的生成結果並不是你想要的,而是模型開發人員認為你想要的。

這樣的設計沒什麼不好,因為有些人只想快速生出圖片,又不太在意細節。同樣任職於倫敦創意運算學院的布萊恩.金斯(Nick Bryan-Kinns)說:「你可能只是想做耶誕卡寄給家人,或幫社區蛋糕義賣設計傳單,這些工具就很適合。」

簡單來說,現有的生成式模型降低了創作門檻,但沒有讓人更容易發揮創意。這兩者大不相同。對庫克而言,長期依賴這類工具,反而可能損害創意發展。「雖然許多創意型AI系統標榜能讓創意更普及,」他在去年發表的論文中寫道,這些工具反而可能「對使用者有反效果,局限了創新、發想與創作的能力」。有鑑於生成式模型標榜人人都能發揮創意,他的這番論點無疑是當頭棒喝。

擔心這些技術會影響認知功能的研究人員,並非只有他一個。微軟劍橋研究院(Microsoft Research Cambridge)在今年2月發表的報告指出,生成式AI工具「可能抑制使用者對作品的深度思辯,導致長期過度仰賴工具,削弱獨立解決問題的能力」。研究人員發現,使用這類生成式工具後,創作者的心思會從「執行任務」轉向「管理任務」。

庫克擔心,生成式工具不讓創作者經歷「失敗」,偏偏失敗正是學習新技能的關鍵。庫克說,我們習慣說藝術家「需要天賦」,殊不知藝術家是努力來的,經年累月不斷琢磨技能。

「去問藝術家,他們會說自己是一而再、再而三地實作才變厲害。」他說:「但失敗的滋味很不好受,所以大家都會想辦法避免。」

生成式模型讓我們跳過了「做不好」的挫敗過程。

「可惜的是,我們正在剝奪培養創意能力最不可或缺的一環,那就是失敗。」庫克說:「但這種話沒有人想聽。」

天外飛來一筆

AI也不全然是壞消息。藝術家與研究人員都在熱議生成式工具的潛力,認為這類工具能夠壯大創作者的能力,引導他們走向意想不到的創作方向,避開死胡同。庫克認為,AI的真正潛力不在於幫我們完成工作,而是協助我們把想做的事做得更好。但他說,要做到這一點,必須打造出新的工具,而非沿用現有模型。「Midjourney對我一點也沒有幫助,因為它不會改變我的固定思維。」他說:「我認為這是錯失了大好的機會。」

請研究創意的學者指出創作過程有什麼關鍵環節,許多人會提到:省思(Reflection)。省思這個概念不容易定義,但主要是指一種專注而有意識的思考方式。靈光乍現的那一刻,是省思;發現自己某個假設有誤、不得不重新思考方法時,也是省思。它與一次性互動正好背道而馳。

人機共創的研究貫穿了一個主軸:探索如何運用AI支援或激發省思過程,也就是要它拋出新構想,或挑戰既有觀點。如果說DALL-E等生成式工具去除了創作的摩擦力,這類研究的目標反而是要重新帶入阻力。「藝術創作怎麼可以少了摩擦?」 在義大利米蘭理工大學(Polytechnic University of Milan)研究設計的季卡迪(Elisa Giaccardi)直言:「如果沒有讓我們傷腦筋的素材,怎麼稱得上是創作過程?」

葳爾森的即時程式撰寫代理人就是一例。她說,這個模型會將她的音樂即興表演帶往意想不到的方向。這個模型以即時程式撰寫社群分享的公開程式為訓練素材,提出的程式片段更接近其他人的風格,反而容易激起創意火花。「並不是你做不到。」她說:「而是礙於大腦的運作方式,往往會沿用已經重複過的構想。」

去年,葳爾森參與由布萊恩.金斯與其同事主持的研究,受測者為6位經驗豐富的音樂人,在創作過程中用過各種不同的生成式模型。研究團隊希望了解哪種AI互動有利於創作,哪些互動沒有幫助。

所有受測者都說,他們喜歡模型提出意想不到的建議,就算這些建議是故障或失誤的結果,也有幫助。這麼創作下來,有時是成果更好,有時是讓人覺得過程耳目一新、更有活力。不過,也有些人放不下控制,因為很難指示模型產出特定的結果,或重現他們先前喜歡的段落。「從某個角度來看,這就像玩樂團。」布萊恩.金斯說:「你要有冒險和驚喜的感覺,但又不希望沒有章法。」

另類設計

對於「驚喜」,庫克切入的角度不一樣,他從自行開發的AI工具導出意想不到的觀點,用來共創電玩遊戲。他在2022年首度發布「帕克」(Puck)AI模型,可以生成類似《糖果傳奇》(Candy Crush)或《寶石方塊》(Bejeweled)的圖形配對益智遊戲。帕克設計出的遊戲大多實驗性質濃厚,呆板笨拙,不太可能會有人想玩。但這不是重點。庫克使用帕克模型與一款稱為「小精靈」(Pixie)的新版工具,來探索大家希望與AI共創工具有哪一種互動。

小精靈會讀取某款遊戲的程式碼,並修改其中幾行,生成不同版本的設計。不久前,庫克正要測試一款熱門遊戲《喋血房間》(Disc Room)的改版,在這款遊戲裡,玩家必須穿越布滿移動圓鋸的房間。他請小精靈設計一關,要讓高手與新手都覺得過關有難度。小精靈最後設計出一個圓鋸全都不動的房間。庫克笑說,完全出乎他的預料:「它把整個房間變成地雷區。」他說:「但我覺得很有意思,因為我沒有想過可以這樣。」

荷蘭台夫特理工大學(Technische Universiteit Delft)的研究人員艾貝格(Anne Arzberger)說,既有的假設被挑戰,是創作過程的一部分。「跟我合作過最棒的夥伴,並不是對我每個點子都說很棒的人。」她說:「這些人反而都很挑剔,構想跟我相左。」

她希望打造出能有類似功能的技術,讓創作過程容納不同聲音。艾貝格在「創造怪物」(Creating Monsters)計畫中開發出兩款實驗性AI工具,協助設計師發掘自身作品的隱性偏見。「我想知道是否能夠運用這項技術,發掘原本難以察覺的資訊。」她說。

在這項計畫中,她與同事研究如何設計出性別中立的玩偶,過程中又有何難處。她與同事(包括季卡迪在內)使用Teachable Machine,後者是Google研究人員在2017年推出的網頁應用程式,讓使用者能輕鬆訓練自己的機器學習模型,用以辨識各種輸入資料(例如圖像)。他們拿幾十張圖片訓練模型,圖片已事先由艾貝格標註「男性化」、「女性化」或「性別中立」。

艾貝格接著要求模型判別新款玩偶樣本的性別,結果發現,就算她努力把玩偶設計成性別中立,但還是有許多款被模型判定為女性化,讓她覺得自己的世界觀(亦即她的隱性偏見)彷彿被攤在陽光下。但這個工具往往是對的:不僅挑戰她原有的假設,也協助團隊進一步優化設計。她說,這套方法也可以用來檢視所有的設計特徵。

艾貝格再使用第二套模型自行生成性別中立玩偶,這套模型開發自生成式影像新創公司Runway的工具。研究人員首先訓練模型生成與分類男性與女性風格的玩偶,接著要它從中找出剛好介於兩者之間的設計。

她指出,生成式模型可以提供設計師察覺不到的回饋:「真的學得到東西。」

拿回主導權

回顧科技史,到處可見重大突破改變了藝術創作的方式,舉凡鮮豔顏料的配方、攝影技術、音樂合成器等,例子比比皆是。1960年代,史丹佛大學(Stanford University)研究人員喬寧(John Chowning)花了多年時間開發出一套高深莫測的演算法,能操控電腦合成音訊的頻率。

史丹佛大學後來將這項技術授權給山葉,山葉又把它內建在自家的合成器(包括DX7機種),因為聲音又酷又新奇,在1980年代多首暢銷金曲都聽得到,包括蒂娜透娜(Tina Turner)的《最好的你》(The Best)、阿哈合唱團(A-ha)的《接納我》(Take On Me)、王子(Prince)的《當鴿子哭泣時》(When Doves Cry)。

創作者與設計師如何發掘新科技的用途,是布萊恩.金斯很感興趣的議題。「藝術家講到AI生成式模型,多半不會把它當成工具,而是覺得它是創作素材,像是顏料之類的東西。」他說。「他們對AI的用途有不一樣的想法。」 但他指出,也有人會刻意用AI技術進行原訂用途以外的創作。藝術家經常會挪用或誤用這類工具,他說。

布萊恩.金斯最喜歡以創意運算學院(Creative Computing Institute)同事布羅德(Terence Broad)的作品為例。布羅德使用的技術包括「網絡扭曲」(Network Bending),也就是在神經網絡插入新的層級,藉此在圖像產生故障般的視覺效果;另一個技術是不對模型進行資料訓練,就拿來生成圖像,產出類似羅斯科(Rothko)風格的抽象色塊。

不過,布羅德畢竟是個極端例子。布萊恩.金斯這麼總結:「現在的問題是,模型的兩端落差太大。一邊是商業導向的生成式工具,產出品質超高,但是你幾乎沒有掌控權;另一邊的工具讓人有完全的掌控權,但門檻很高,只有對電腦駕輕就熟的人才能上手。」

「這種人不多。」他說:「這樣的藝術家少之又少。」

艾貝格坦言,她的模型並不容易操作,執行時間動輒數小時,她甚至不確定市面上還找不找得到Runway。布萊恩.金斯、艾貝格、庫克等人發現了人機共創的可能性,希望把這樣的創意互動轉化為工具,讓不是重度撰寫程式的創作者也能使用。

但要在「驚喜」與「掌控」之間找到平衡點,勢必有難度。Midjourney雖然能帶來驚喜,但使用者無法掌握超出指令之外的生成內容。有些人說,下指令本身就是一種創作。「不過,拿畫筆創作雖然不簡單,下指令的難度更高。」庫克說。

他有時發現學生碰到這個難題,乾脆接受生成式工具給出的第一個結果。「我很想知道我們是不是漸漸麻痺了,只要模型產出什麼,就認定那是自己要的結果。」他說。他目前正在設計一項實驗,會微調類似指令的字詞,測試使用者是否能看到預期結果與實際結果之間的落差。

但相關技術的發展還在早期階段。現階段而言,開發生成式模型的企業往往重成果、輕過程。「演算法的進展讓人驚豔,但互動設計(Interaction Design)的環節常常被忽略了。」瑞茲瓦娜說。
對葳爾森來說,人機共創關係中最關鍵的抉擇,是你如何處理AI給你的素材。「你是在協調你與電腦的互動關係。」她說:「有時候會出錯,但這本來就是創作的一部分。」

當AI丟給你一顆檸檬,就創作出藝術吧!「表演過程如果有AI跟你唱反調,甚至像在跟你吵架,不是很好玩嗎?」 她說:「起碼觀眾看了會覺得很有趣。」

海文為《麻省理工科技評論》資深編輯,負責人工智慧領域。Copyright©2025, Technology Review. All Rights Reserved.

下載全文PDF Icon下載全文PDF