AI 法官的技術邊界:它能做出好判決嗎?
儘管 AI 尚未披上法官袍,但愛沙尼亞構想彷彿是驚天一雷,預示出可能的未來圖像。許多人或許有同樣的好奇:AI 當法官究竟行不行?
李建良分成不同層次來討論:
行不行有兩層涵義:能力上行不行,規範上可不可以。
第一層次是「可能性」問題:AI 法官足以擔任人類法官的角色嗎?更直白地問:AI 真有那麼厲害,能夠做出好判決?
要確認 AI 的能力,首先我們得問:什麼是好判決?
「這牽涉社會對法院判決的評斷標準。」李建良分析,一種標準是檢視「判決結果」;另一種則是審視「判決理由」,法官在判決書詳述的心證,如調查結果、採信哪些證據、證據效力、法條依據等。
若觀察近年台灣社會的現象,大眾似乎較關注判決結果。好比引發社會矚目的「台鐵殺警案」,這樁尚未確定的爭議案件,引發了司法當局對司法鑑定制度的重視與檢討,而輿論譁然多半是殺人無罪的結論,批評法官「不接地氣」,關於心證過程的討論相對較少些。
換言之,假如重視結果,那不難想像 AI 法官有能力透過歸納、類比分析對案件做出判決。但若我們在乎法官為什麼、如何做出裁決,依照目前技術和愛沙尼亞計畫,AI 所產出的可能只有答案,但沒有理由(或較簡式的理由)。
這形成了第一重挑戰:
若 AI 法官無法清楚說明理由,我們如何檢視它的判決好不好?有沒有瑕疵?
有些人也質疑,AI 的精準、一致可能反倒是弱點。現行 AI 不具有真正理解他人的能力,無法實際參與答辯交鋒和開庭審理,而許多訊息來自臨場、個別案例的判讀,並非用數據化與資料化就足夠解釋,背後涉及文化、風俗、情境常識,相當複雜。
不過,AI 派並沒有全輸!
首先,技術可能超前突破,讓 AI 未來也有能力寫判決書、說明論證。另外若拿現行制度相比,美國陪審制同樣只宣告:「陪審團認為無罪」,不會附上理由。更何況所謂的情境判斷,經常也會造成主觀性偏誤,《美國國家科學院院刊》(PNAS)研究發現,接近午餐時間法官對假釋認定較嚴格,用餐休息後,假釋審查就變寬鬆了!
想要假釋,還得祈禱法官吃飽飽?恐怕多數人難以接受。
鐵面無私包青天? 小心 AI 的內建歧視
總地來說,理性、客觀幾乎是 AI 的最大光環,以準確一致的邏輯做判斷,不受法官個人情緒與好惡影響。
但真是這樣嗎?許多研究證實:AI 默默戴上了有色眼鏡! COMPAS 系統被抨擊帶有種族歧視,有色人種更容易被預測為高再犯率;亞馬遜招聘、蘋果信用卡信貸系統都曾被發現隱含性別差別待遇。