上面這樣的答案看起來還滿有說服力的,至少對我們這一年代開始認識電腦的人們來說,如果談及規則性的東西,可能會更認定機器應該受程式碼掌控。至少在類神經網路近年再次崛起之前,我們很容易想像機器可以是寫好的工具,而那些充斥自然語言的科幻設定更多是為了好看的故事。
然而,隨著2022-23生成式AI浪潮掀起,另一種更有意思的答案則開始變得明顯。也就是,自然語言的大量使用可能不只是科幻故事性的需求,或許也是現實中實務的需求。
自然語言作為AI發展實務上的工具
其中一項最直接的考量就是功能性:當機器和AI要與人類互動時,如果能透過自然語言下達指令和獲取回饋等,那將會是最消費者親近的選項。
而在這種考量之外,近期AI浪潮背後所挾帶的訊息,乃是某種程度來說,建立在自然語言的AI,甚至比用程式語言寫出的還要容易產生某些功能。
一個較為明顯的例子,就是人類至今很難用程式語言去條列「寫」出 ChatGPT這樣的東西。如今的生成式AI,大量使用自然語言作為prompt和指令,其本質上不是透過工程師將詞語的意義「寫」出,而是透過精煉現存網路上大量的,自然語言和自身及其他各項元素的「連結」。
或許大膽一點我們可以說,這一波生成式AI之所以進展得如此迅速,或者達成的程度如此出人意料,其中一個原因就是因為它們是建立在整個網路和各種資料中以自然語言為主的連結上,這當中包含自然語言和自然語言的連結、自然語言和圖像或聲音的連結,以及自然語言和程式語言的連結等。
舉例來說,當圖像生成AI或音樂生成AI決定要生出來的東西長什麼樣的時候,它們所接收到的,正是含有自然語言的prompt。這些prompt能夠調動AI經過訓練所內化的,來自龐大資料庫中自然語言和相關元素的連結。
因此,如今的AI作畫或作曲,使用者不一定需要輸入圖像或聲音的內容。有時候只需要輸入自然語言的內容,就能得到對應的圖像或聲音內容。即便使用者使用的是類似圖生圖這類的功能,倘若能加上自然語言的prompt雕塑,通常也會使生成結果更有操作性,以及更趨近使用者想要的模樣。
換言之,自然語言資料庫提供了大量本身因為相互間連結不同而有差異的資料,當生成式AI在訓練中拾取這些資料並對應連結的參數時,它們同時也帶入了自然語言本身豐富的內容和變化。更重要的是,自然語言(為自身和其他元素)帶來一種可以界定的性質。自然語言資料庫有多少字詞和組成可以提供相關連結,那麼這些AI就可能從當中拾取多少內容。而當生成式AI內化這些連結內容後,使用者就能夠用自然語言調動蘊藏在其背後,由大量連結的資訊中洗鍊而出的,對那字詞「概念」的展現。