電腦當然不會閱讀,至少和你閱讀的方式很不一樣。不過電腦可以用處理程式語言的方法讀書,它們先「看書」(也就是先接收資料),再把資料區分為人類所謂的意義單元,像是字母、標點、字詞、句子和章節等。所以電腦的確能模仿人類閱讀,而且訓練過程愈嚴謹,理解程度就愈擬真。而人類讀者和機器讀者的差別在於,人類知道他們閱讀的內容有意義。
話雖如此,電腦的閱讀方法卻能讓我們更接近小說描繪的細節,就連閱書無數的文評也甘拜下風。那是因為電腦擅長辨識模式,而且可以大規模處理模式和細節,但人類卻沒有辦法做到。
大家想想我們的研究初衷:暢銷書到底能不能預測?想做預測,就要先剖析過去重複發生的模式。除非你會占卜,否則預測未來靠的是熟悉歷史。一般來說,在字裡行間尋找有意義的模式是文評或學者的工作。著有《千面英雄》的神話學者坎伯,傾其一生研讀世界各地的故事,還刻意訓練他的眼睛去辨識這些故事的相似之處。他可是辨認模式的大師,儘管如此,一個人一輩子能做的終究有限,不論是閱讀的數量或觀察的細膩程度。辨認模式既要看微觀的細節,也要看宏觀的趨勢,而人類在這兩個面向都有規模上的限制。
但幾部經過訓練的電腦,可以在一天之內就讀完數千本小說,消化完數千筆資料,而且絲毫不放過人類可能會忽略或習以為常的各種細節。
舉個例子吧。我們在閱讀的時候,尤其是受過訓練、擅長捕捉細節的讀者,都會注意到作者使用了哪些形容詞。但我們大概不會注意到名詞和形容詞之間的比例,這個比例代表了作者有多常使用形容詞去描述一個名詞。電腦可以輕易找出這種資訊,讓我們更清楚作者的敘事方式與風格。電腦不僅可以縝密搜索,還可以比較這本書和另外上千本書的差異。如果電腦發現暢銷書裡形容詞與名詞的比例偏高或偏低,那這個寫作特徵就很重要了。
下次你找書來看的時候,不妨做個實驗,別管朋友的推薦也不要執著於熟悉的作者和類型,試著連續一週都只看《紐約時報》暢銷榜上的書。如果你讀得夠仔細,你就會變得有點像我們的電腦,不論是文學作品或大眾讀物、男性書籍或女性書籍、明星作家的小說或普立茲獎得獎作品,你都能開始看出各種書籍之間意外的共同模式。
有些模式可能會讓你很驚訝,譬如說,你會納悶為什麼女主角通常都是二十八歲。這重要嗎?你可能會問自己:如果一本小說長達400頁,作者是不是刻意把第一場床戲安排在第200頁?如果全書只有220頁,那第一場床戲則會落在第110頁。如果真是這樣,為什麼?你可能會和朋友討論,小說若有一個吸引人的開頭卻沒有一個讓人滿意的結局,銷量會不會受到影響?搞不好你還會覺得這些分屬不同類型的暢銷書有太多潛在的共同點了,根本可以自成一派。