Connect with us

副刊

無名周記:不偏不倚的Grokipedia? 誰的偏見?誰的陰謀?(下)

發佈於

【明報專訊】特朗普支持者一直指控BBC、CNN等主流傳媒「偏頗」,科企大亨馬斯克上月底推出由旗下AI Grok撰寫的Grokipedia,聲言要取代偏頗的維基百科。馬斯克聲稱Grok是最聰明的AI、「最大程度追求真相」。不過,Grok本身經常被網民揭發撒播虛假資訊,最近Grok便大讚馬斯克英俊非凡。所謂情人眼裏出西施,馬斯克是否英俊大概很難作事實核查,但Grok撰寫的百科全書又是否真的中立客觀呢?

維基百科2001年1月成立,以群眾協作方式編寫百科全書,至今已成為全球最常使用的參考網站之一。自創立以來,圍繞其「是否真正中立」的爭議從未平息。由於維基百科依靠志願者參與,編寫者往往因興趣、動機或政見相近而聚集,形成所謂「自我選擇偏差」(self-selection bias)。亦有論者指出,編輯社群以男性為主,加上維基百科大量依賴既有文獻與傳媒,維基百科所呈現的世界難免偏狹。

不過,近年針對維基百科偏頗批評多是保守派。特朗普的親信、AI顧問David Sacks在9月大肆評擊維基百科「徹底偏頗」,並警告由於維基百科經常在Google搜尋結果的前列,如今更是訓練AI模型的主要來源,維基百科的偏頗將影響深遠。美國共和黨參議員克魯茲(Ted Cruz)10月3日更向維基媒體基金會(Wikimedia Foundation)總裁發信,指控維基百科偏頗。他特別指控維基百科的「可靠資料來源」清單,把CNN、MSNBC等自由派傳媒列為「通常可靠」,而保守派的霍士在政治及科學議題上則被視為「通常不可靠」。他又指維基百科有人有組織地散播反猶太敘事,要求維基基金會「提供關於維基百科意識形態偏見的資訊」。面對批評,維基百科指編輯一貫透明,強調社群能夠起監督作用,亦盡力確保撰寫的內容引述的來源全面,不偏袒任何一方的資料來源。

馬斯克一直主張言論自由為絕對價值,質疑主流傳媒以至互聯網平台由左派操控,審查保守派觀點。他聲稱AI可以為人類提供中立的資訊。他的Grokipedia(姑且簡稱為G百科)是Grok利用維基百科的文章作基礎改寫。據馬斯克,該百科全書其中一個任務便是不再側重傳統傳媒作資料來源。

G百科與維基百科怎樣看「英國優先」?

G百科面世以來,不少傳媒及學者都加以檢查。G百科最惹質疑的便是對極右翼組織的「客觀描述」,其中英國極右組織「英國優先」(Britain First)被形容為「愛國政黨」。「英國優先」在2017年在twitter發布針對穆斯林的影片,被Twitter禁制,但馬斯克2022年入主twitter後解禁;其領袖也曾因針對穆斯林的仇恨罪案被捕。維基百科是這樣寫的(以英文版為準):「英國優先是由英國國家黨成員在2011年創立的一個極右、英國法西斯、新法斯政黨及仇恨組織。」這些標籤的來源都來是主流傳媒,包括英國第四頻道、半島電視台、紐約客等。當然,是否有必要用那麼多標籤來形容它當然可以研議,G百科則完全刪去這些標籤,雖然內文亦有提及該黨的爭議,但其文章第一句是這樣的:「英國優先是一個愛國政黨,主張國家主權,在福利及房屋上以土生公民為先,以及捍衛基督宗教傳統抵抗大規模移民及伊斯蘭主義者抗張。」怎麼讀起好像文宣?不錯,這段話的資料來源是英國優先網站。

G百科引用極端組織作資料來源引來不少學者及傳媒批評。康乃爾大學科技校區(Cornell Tech)兩名學者最近便發表文章,指G百科引用了陰謀論網站Infowars作為來源34次,白人民族主義網站VDare作為來源107次。而維基百科並不將這些來源視為可信。

G百科偏袒右翼組織嗎?這似乎符合外界對馬斯克的印象。維基百科強調編輯過程透明,由志願者編輯組成的社群就各種修改建議討論,文章修改的時序都可以追查到。G百科亦強調透明,不過修改決策則由AI大神全權負責。G百科有編輯(edit)一欄供用戶提出編輯建議及追蹤文章改動,但接納與否則視乎AI大神,很大程度也視乎用戶如何跟AI溝通——有跟ChatGPT等生成AI打交道的都知道,撰寫適當提示語令AI了解你並做到你要求,其實是特殊技巧。老實說,查看AI大神如何採納或拒絕修改建議,遠比G百科本文更精彩。

AI如何抉擇編輯建議?

G百科「俄羅斯入侵烏克蘭」(Russian invasion of Ukraine)條目一直惹來質疑偏袒俄羅斯。平情而論,俄羅斯入侵烏克蘭仍然在進行中,各種親俄親烏觀點一直激烈交鋒,任何文章都可以惹來偏頗指控。由於時間關係,這裏只針對該條目的導言。

跟維基百科類似條目相比,G百科的導言簡短得多,但對於俄羅斯入侵烏克蘭的理由,則只引述俄羅斯官方說法,稱在俄羅斯官方的說法中,行動是一項「特別軍事行動」,其目標是要將烏克蘭「去軍事化」與「去納粹化」、保護俄裔免受「種族滅絕」以及阻止烏克蘭加入北約。導言未有完全平衡俄羅斯的說法,僅在「種族滅絕」指控一句提及國際機構評估認為指控無根據。導言結尾則簡單介紹俄羅斯入侵烏克蘭的種種爭議。

反觀維基百科2022 Russian invasion of Ukraine的條目,導言部分雖然亦有提及俄羅斯觀點,引述俄羅斯總統普京2022年2月24日的電視演說,但行文措辭較有批判意味,補充:「普京提出具領土收復主義與帝國主義色彩的觀點,質疑烏克蘭作為國家的合法性,並毫無根據宣稱烏克蘭政府是新納粹,正在對頓巴斯的俄裔實施種族滅絕;他同時表示,俄羅斯的目標是讓烏克蘭『去軍事化』與『去納粹化』」。

查看G百科的編輯建議,那句提及種族主義指控沒有根據的句子是11月20日才加進去的,亦是G百科用戶花了3周才「成功爭取」。翻看過去數周的編輯建議,不少用戶都針對文章太偏頗俄羅斯說法,質疑不應引用克里姆林宮官網作來源,有些用戶更激動斥G百科散發假資訊和俄羅斯文宣。

但發脾氣對AI沒有效。回顧3星期以來的編輯建議,針對應不應使用克宮作資訊來源,AI大神稱,全盤否定克宮作為資訊來源並不合理,因為那是俄羅斯的官方立場來源,拒絕修改建議。另一用戶則指出,導言沒有引用烏克蘭的觀點,有失偏頗。AI大神反駁,加入未具體說明內容的烏克蘭方面來源,「有可能將基輔官方敘事納入,而該敘事可能強調情緒化或政治化的說法,而非可實證的資料;在戰時情境下,各方均有誇大的誘因,因此此舉未必能提升中立性」。

這解釋似乎很中立,但同樣理由也可用來質疑為何引用俄羅斯官方立場沒有類似問題。當然,該名用戶的建議亦欠具體。到了上周四,有用戶指出俄羅斯的「去納粹化」及「種族清洗」並無證據支持。AI大神表示,經過網上搜尋後,確認有國際機構明言俄羅斯指控無證據,因此決定補上一句,但仍然拒絕加入非俄羅斯觀點,認為文章後半部已有包括,毋須在導言加入。究竟AI大神為何回心轉意?它是基於什麼原則判斷?純粹是因為用戶寫的東西讓AI明白?抑或根本不是AI,而是有人察覺外界對該條目的關注,不得不稍作調校以平息爭議?我們事實上無從得知。

自以為全知全能最危險

回頭再看維基百科的條目,又會否有人質疑太過反俄,有失偏頗?我相信一定有。偏頗觀感事實上無法根絕,如1985年經典研究發現所謂敵意媒體現象(Hostile Media Phenomenon),即衝突中立場相對的支持者,會將同一篇新聞視為「偏向對方、對自己不利」。人們本身難以擺脫偏見,又總覺得對方偏頗,而大型語言模型(LLM)所依賴的數據都是人類已有資訊,如果材料本身已偏頗,經偏頗材料訓練出來的LLM又如何可以擺脫偏見?過去,已有AI學者指出AI會放大人類固有偏見問題。馬斯克可能認為,只要加入一向被主流排斥的資訊來源,便可以「平衡」。不過,這是假設所有資訊的價值與可信度都是對等的,只需以五十五十的方式並列便能逼近真相。惟事實往往相反──主流之所以排拒某些來源,很多時候是因為它們與既有證據相矛盾,甚至涉及明顯錯誤。如果資訊本身有問題,讓它擁有跟正確資訊同樣篇幅,只是給予謊言合法性而已。

毋庸諱言,AI將會繼續進步,但它是否真的可以擺脫偏見?維基百科一直沒有迴避偏見指控,而是透過公開透明的審查機制來應對問題。沒有人會說這是容易,但最危險的可能並非偏見——覺察到自己有偏見並加以改善,是一件好事;最危險的是自以為全知全能,誤以為自己沒有偏見。

文˙林康琪

編輯˙梁曉菲

fb﹕http://www.facebook.com/SundayMingpao