阿將伊崮喜瀾觀點:當皮衣黃大叔遇上AI影片生成─驚喜還是驚嚇?

2024-06-14 07:00

? 人氣

創造力:AI影片生成的「文藝模範生」

從創作的角度來看,系統還需要具備一定的創造力和審美能力,並根據使用者的需求和影片素材的特點,生成具有藝術感和觀賞價值的影片(Ye等,2023)。這意味AI影片生成不只是簡單的素材拼接,而是一個智慧創作過程。我們的程式不僅要能理解影片內容,還要能把握影片的風格、節奏、情感等藝術元素,並根據一定的美學原則,進行創造性的組合和編排。這需要在開發AI影片生成系統時,引入更多的藝術理論和美學原則,讓程式學會如何創造出打動人心的作品(Zylinska,2020)。例如,我們可以將電影編劇理論、導演構圖技法、色彩心理學等藝術理論和原則納入模型訓練。讓AI學習如何從講述一個吸引人的故事開始,如何營造美麗的畫面,如何透過色彩傳遞情感。我們還可以引入音樂理論、節奏學等知識,讓AI學習如何透過背景音樂和節奏安排來烘托主題,渲染氣氛(Henriques,2020)。總之,我們需要全方位地提升AI的藝術修養,讓它成為一個真正富有創造力和審美能力的「影片藝術家」,而不僅僅是一個簡單的「影片拼湊機」。 

透過<Google新聞> 追蹤風傳媒

科技實現:「登堂入室」還是「班門弄斧」?

系統通常會將影片資料庫中的每一個影片片段表示為一個高維向量,捕捉其顏色、紋理、物體、場景、動作等特徵。當使用者輸入一個查詢時,系統會將查詢轉化為向量,然後使用向量檢索算法在影片向量資料庫中找到最相似的影片片段。這個過程可以使用如Faiss、Annoy等高效的向量檢索庫加速(Chaidaroon,2020)。找到相關影片片段後,系統會使用循環神經網路(RNN)、長短期記憶網路(LSTM)、變分自編碼器(VAE)等模型(Park等,2021)。,對選中的影片片段進行智慧組合和編排,考慮影片片段之間的語義連貫、視覺銜接與節奏韻律等因素,生成流暢、有意義與藝術感的影片。在這段過程中,生成對抗網路(GAN)等模型尚需對生成影片進行品質評估和優化,以確保視覺品質和語義能夠準確達標(Bandi等,2023;Kumar與Singh,2023)。 

值得一提的是,向量科技不僅使得影片檢索和組合更加高效,也為AI影片生成賦予更多的創意。透過在高維向量空間中進行插值(interpolation)、外推(extrapolation)與融合(fusion)等操作,AI系統能夠生成全新的、前所未見的創意與超現實的視覺體驗(Po等,2023;Ye等,2024)。例如,AI可以在兩個不同風格的影片向量之間進行「插值」,生成一個漸變風格的影片;也可以在一個影片向量的基礎上進行「外推」,生成一個延續原有風格但具有新元素的影片。向量科技為AI影片生成開啟無限創意,使其能夠超越簡單的模仿和拼接,而進行真正的創造和想像(Buckner,2024)。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章