2012/11/12

美國2012總統大選(3) 歐巴馬的數值分析中心

2007 年,當年輕的歐巴馬出馬要爭取美國民主黨總統初選的時候,幾乎沒有人看好這個在全國政壇少為人知的晚輩。他的從政經歷是只當過一任參議員,在民主黨內,他必須打敗強勁的對手希拉蕊克林頓。希拉蕊是之前兩任總統克林頓的老婆,不但『白宮資歷』豐富、個人能力超強,而且,克林頓執政時期是美國經濟最好的時期之一,以克林頓的政治力量與民間支持度,以經驗、財力、物力來比,沒有人會認為誰有可能在民主黨初選中打敗她。

但是歐巴馬做到了。他靠的是一個做事效率非常好,紀律非常嚴明(保沒有人爆料,記者都挖不到秘密),而且了解現代網路力量並能夠充分加以利用的競選團隊。台灣的讀者應該記得蔡英文競選 2012 總統時用的小額捐款。歐巴馬在 2008 年的大選就使用過這一招。

當年歐巴馬贏得民主黨初選之後,一路把共和黨的老將麥肯打得毫無招架之力,結果以懸殊比數打敗麥肯而拿到總統寶座。

那是 2008 年的事。底下要介紹的是歐巴馬這個競選中樞經過四年的演變與升級,成為今年效率驚人的高科技競選神經中樞。

一開始就決定使用科學化數值分析

歐巴馬的團隊很早就在各地進行地方組織的佈建工作(ground work),這是早為人知的。但極少人知道的是,這些地方佈建工作只是表面上的,在那背後,是一個高度保密的資料蒐集、匯總、分析、研究的數值分析團隊。

Clooney
在今年晚春的時候,這個資料中心發現一個現象:在美國西岸,如果在歐巴馬的募款餐會中,找來電影明星 George Clooney,將使得 40~49 歲的婦女超級慷慨地掏腰包。這給他們一個念頭:在美國東岸,誰可以具有像 George Clooney 一樣的魅力?

Parker
他們把過去所蒐集的資料找出來分析,並根據結果邀請了著名電視演員 Sarah Jessica Parker,以競標的方式募款,讓得標者可以到 Sarah 家裡或她的餐廳吃晚餐,這果然幫歐巴馬的競選團隊募得了巨款。

一般民眾無從知道的是:歐巴馬陣營這個邀請 Sarah 的舉動,不是突發奇想,而是根據對於資料背後的客觀現象的研究分析而發現的選民特徵:喜歡競賽、喜歡跟明星一起晚餐。

對歐巴馬的陣營來說,這是一開始就訂下的競選策略。他們從一開始就決定:這會是一個跟傳統完全不同的、以數據來引導的競選。雖然競選最後是以政治為目的,但選戰過程卻不一定是靠『政治本能』來指導。他們一開始就決定要『測量』選戰中大大小小所有的因素。他們的分析部門為此擴增到 2008 年的 5 倍大, 並邀請的專門分析巨額資料的分析專家來負責。

列為高度機密的數值分析中心

但到底這個龐大的資料分析部門確切在幹什麼,卻一直被列為高度機密。他們用神秘的名稱,譬如說『獨角鯨』 (Narwhal) 或『捕夢者』,來稱呼該部門中的資料分析試驗計劃。
獨角鯨
甚至連辦公室也跟其他的競選幹部保持隔離,而設立在巨大的競選總部遙遠邊緣的一個沒有窗戶的房間。裡面的科學家不斷地向歐巴馬與其助理做簡報,但對外界卻高度保密。他們認為這是他們在組織建構上對付羅姆尼的最厲害武器。

在大選之後,這個高科技的競選中心總算公開了他們的尖端科技。他們呈現給世人的,是一個超級巨量的資料分析研究單位,不但幫歐巴馬募得相當於新台幣 300 億的巨款、重新調整電視廣告的對象,並針對搖擺州選民建立了詳細的研究模型,找出任何可以增進競選電話、挨家挨戶訪問、郵件與社群媒體等競選效率的任何因素。

整合各種資訊的巨型資料庫

歐巴馬在 2008 年競選對資訊的掌握已經很先進,但同時卻因資料過於龐大而造成問題。義工們由歐巴馬網站拿到的催票名單,跟經由辦公室拿到的催票名單不同,也跟募款名單不同,造成到處都是資料庫,但卻各自為政互不分享的混亂情形。所以他們花了整整 18 個月的時間建立了一套系統,將來自民調、募款、實地採訪、消費者情報以及社群媒體與行動電話的聯絡對象等所有資料庫,跟民主黨的主要選民資料庫進行整合。

這樣形成的巨型資料庫,不但讓競選團隊知道如何找到選民並吸引他們的注意力,更讓資料分析員能夠進行測試來了解什麼樣的競選方式能夠吸引什麼樣的選民。譬如說,在各地競選辦公室所準備的電話名單,不光只有選民的姓名跟電話號碼,還有根據『可說服度』而建立的排名(persuadability),最容易被說服的排在名單最前面。選民的基本資料:年紀、性別、種族、住宅區與投票歷史決定了百分之75的可說服度,剩下的則靠選民的消費傾向。藉此,他們可以預測或模擬哪一個選民比較會經由網路或經由郵件捐款。譬如說,他們發現那些在 2008 年有訂閱歐巴馬的競選電子郵件,但後來不再續訂的選民,可說服度是最高的。

根據類似這樣的資料,歐巴馬的數值分析員將選民區分成不同的選民結構群體,進行各種不同的測試來決定專門對於該群體的特殊拉票方式。譬如說,他們發現,由搖擺州內選民住區當地的義工來打電話,會比從外州打進來的效果要好得多。

競選團隊以這種方式建立了對於各種假設的預測,而這些預測幾乎都是以數據為根據,很少有靠政治直覺的判斷。

增進募款效率

這個巨型資料庫同時讓募款更有效率。競選團隊事先完全不敢相信300 億(新台幣)的募款目標,但在夏天,網路活動以爆炸性成長之後,他們達到了這個目標。這個網路募款主要歸功於精細的、以數據為根據的電子郵件競選方式,每天有幾十個訴求經由電子郵件送出。如前所述,最關鍵的因素在於資料的蒐集與分析。有很多電子郵件純粹是用來測試以何種方式可以增進募款效率。試驗之一,是用不同的郵件標題、不同的寄件人、不同的信件內容,將結果加以分析看看何種組合可以募到最多錢。譬如說,由歐巴馬的老婆蜜雪兒送出的電子郵件,通常比其他人送出的更容易募到錢。

另外,他們發現有註冊參與一個可以透過網路或簡訊,不必重新登入就可以重複捐款的『快速捐款計劃』(Quick Donate program)的支持者所捐的捐款量是一般支持者的四倍。所以他們擴充這個計劃,並贈送競選貼紙鼓勵更多人註冊。

預測投票率

在募款所採取的這一整套,同時應用到對於投票率的預測上。分析團隊用四種不同的民調資料,針對搖擺州建立了非常詳盡的選民藍圖。選前一個月,分析團隊光在俄亥俄州就對 29000 選民做了民調。這已經涵蓋了 0.5% 的俄亥俄州選民,使團隊可以了解不同人口與地區的選民在任何時刻所關心的議題。

這讓團隊佔盡極大優勢,譬如說,在歐巴馬在第一次大選辯論(10月3日)令人慘不忍睹的失敗之後,他們分析了哪些支持者改變支持對象轉而支持羅姆尼,哪些仍然繼續支持歐巴馬。在選前混亂不明的一個月,這些研究讓他們了解到:那些因為辯論而轉變立場的人,本來就不是歐巴馬的支持者,而多半可能是羅姆尼在之前因為一連串的競選失誤而轉而支持歐巴馬的選民。這使得競選團隊在歐巴馬的選情看起來要被羅姆尼趕上的時候,比一般人更能保持冷靜。

這些民調與選民資料每天都被重新分析與測試,並進行模擬投票以用來預測各種可能的意外情況。他們等於每天都在經歷投票日當天的情況。平均每天晚上進行了 66000 次模擬投票。每天早上,這些模擬投票會告訴他們:這是你們目前的當選機率。他們根據這些模擬結果來重新調整要在那些方面投注更多資源。

在網路方面,他們採用了史無前例的大量臉書催票來複製傳統的挨家挨戶的拜訪方式。在最後一個禮拜,上網下載他們的一個軟體的選民,會接到一個附有他們住在搖擺州的朋友的相片的訊息。只要按一下訊息內的一個按鈕,就可以自動提醒他們的朋友要立刻採取行動,譬如說趕快去選民登記、去提早投票、或是當天去投票。他們發現,被自己在臉書上認識的朋友提醒或拉票的選民,有 20% 會採取行動,主要是因為拉票是來自認識的人。

增進廣告效率

除了幫助募款、預測投票率以及催票以外,資料庫也用來調整廣告的購買方式。傳統的競選是僱用所謂的媒體顧問專家來決定要如何買廣告。相對的,歐巴馬的競選團隊完全以內部民調資料為基準。他們可以針對特定地點的特定選民結構,設計出特定的廣告與播放時間,因此看起來,他們的廣告會出現在一些看起來跟政治完全無關的莫名其妙的節目與時段裡。根據他們的評估,因為把錢花在可說服度高的選民,使得他們的廣告比 2008 年更有效率得多。

幫助歐巴馬選擇競選場合

這些資料庫甚至還影響了歐巴馬的競選場合,包括出現在社群新聞網站 Reddit 來回答選民的問題。為什麼要去連很多歐巴馬的資深競選成員聽都沒有聽過的網路社群?很簡單,他們的資料告訴他們:歐巴馬的很多催票對象是 Reddit 的網友。

另外一個例子,是九月中,以色列總理 Netanyahu 趁著到紐約參加聯合國大會的機會,公開要求歐巴馬對伊朗採取強硬立場做出承諾,並要求歐巴馬要跟他會談。但是歐巴馬辦公室卻以行程緊湊為由拒絕會面。歐巴馬不但沒有會見他,甚至連聯合國大會中,世界各國領袖難得在紐約聚集的時候,他竟然沒有去跟他們打招呼,反而跑去婦女節目接受訪問,在節目中跟幾個女性主持人聊天。

這個舉動讓所有競選專家大惑不解。有人說歐巴馬拒絕會見以色列總理,難道不怕得罪美國的猶太人。CNN 一個曾經在好幾任總統身邊當過顧問的資深政論家 David Gergen 說,在各國領袖面前握手拍照,這對歐巴馬的領袖形象應該是大大的加分,他搞不懂為什麼歐巴馬寧可跑去婦女節目。

但如果熟知歐巴馬的競選模式就知道,統計資料顯示美國人根本不怎麼關心外交,即使是美籍猶太人之中,也只有 4% 在意美國怎麼對待他們的祖國以色列(68% 在意經濟)。換言之,歐巴馬的競選行動是以客觀資料來導向的,而不是傳統的『政治感覺』。這跟共和黨主要靠主觀感覺的競選方式完全不同。

這個以數據為主導來做選戰策略決定的模式,在幫助歐巴馬競選連任中擔任了不可或缺的關鍵角色。這個模式的成功,意味著華府那些傳統的所謂選舉專家,他們靠經驗與直覺來競選的方式將快速被淘汰,而被新一代的,有能力分析巨大數量的資料庫的數據分析專家與電腦程式員所取代。換言之,在政治領域上,我們已經進入『大量資料庫』的時代。歐巴馬這個效率驚人的客觀數值化競選方式,應該可以給關心台灣政治與選舉的讀者一個相當重要的啟發。

後記:

這是筆者有關於這次總統大選的第三篇文章。之前第一篇簡介歐巴馬與羅姆尼【1】,第二篇介紹美國總統選制【2】,第三篇本來要寫這次大選觀察到的部分綠營人士的無理性的偏激言辭,不過網友直江山城守已經說了個大概【3】,筆者就暫時不談,這一篇改介紹歐巴馬做為競選團隊神經中樞的高科技數值分析中心。本文的大部分內容來自時代周刊的一篇文章【4】。如果時間許可,我們可以再討論羅姆尼陣營用來對抗歐巴馬的『獨角鯨』,最後問題百出而被某些人稱為災難的『逆戟鲸』(Orca) 計劃。

參考:

2012/11/04

美國 2012 總統大選(2)選制簡介

這是有關美國總統大選的第二篇文章。之前一篇是歐巴馬與羅姆尼的簡介【1】。這一篇談選制。

美國總統選舉的制度,跟台灣的最大不同就是在經過全民投票 (popular votes) 之後不是直接加總看誰票數多,而是由各州的選舉人團 (electoral college),根據該州在全民投票中投票結果來投出選舉人票 (Electoral votes),最後將各州選舉人票加總來決定。

美國每一州依照人口比例形成相對配額的選舉人票。人口越多的州,選舉人票配額越多。最大的加州多達 55 張,超過全國 10 分之一。最少的幾個州每州只有 3 票。

選舉人團投票的方式是:在第一輪全民投票(11月6日),決定該州的選民投給那個候選人之後,這一州的選舉人團成員(Electors) 會在 12月17日 開會投票。半數的州有立法規定:選舉人投票一定要投給該州選民選出來的人。其他州則選舉人團的成員有權利決定投給任何候選人【2】,但如果成員選的不是該州選民決定的人選,將被視為違背民意,因此在美國歷史上選舉人團幾乎都是照州民的多數選擇。

於是這一州的所有的選舉人票票數都算成該候選人的票,形成『贏者全拿』的特殊現象(內華達州與緬因州除外,不過影響不大)。

缺點

這個選制一直被批評,因為(1)在某一州投輸的選民,他們的票數在第二輪選舉人票的計算上,被算成是支持對方候選人的,形成了票票不等值的不公平現象。

(2)對小黨極端不利。譬如保守的奧克拉荷馬州,一直是共和黨的地盤,今年到目前為止民主黨、共和黨支持率為 32%:63%,相差達 ~30%,投給民主黨等於投給共和黨,所以奧克拉荷馬的民主黨可以說是在投心酸的。被夾在兩大黨之間的小黨就更不用說了。

(3)可能會有這樣的結果:在全民投票總票數贏得對手的候選人,在最後選舉人票加總的時候卻輸掉了。美國 2000 大選就發生這樣的事,在普選贏得多數的民主黨候選人高爾,在選舉人票中敗給共和黨的小布希。我在本文後面的附錄中用一個假設性的簡單計算來示範這種可能性。

優點

但這種制度有什麼好處呢?我可以想到兩個:

(1)如果美國採取像台灣一樣一階段全民投票,那候選人算一算,只要幾個大州拿下,勝敗就決定了,這種情況下,候選人只要集中在幾個大州,在大州投下人力物力資源催出更多票就可以贏得選舉,而不會浪費資源去那些小州,因此大小州每經過一次選舉,受重視程度的差距就擴大一次。加了一層選舉人票的設計之後,可以防止大小州差距過大。

美國歷次選舉,如果是勢均力敵的話,就會有幾個中小型的州會變成影響美國總統大選的關鍵『搖擺州』,不少網友說要搬去那些州來選總統。目前搖擺中最關鍵的俄亥俄州,兩大黨資源全力投入奮戰,聽說在俄州克里夫蘭市的電視台廣告費是競選之前的 400 倍。

如果美國只採用全民直接投票,這些中小型的州恐怕永遠也不可能扮演這麼重要的角色;

(2)另外,我認為非常重要的,美國東北部正遭受超級大風災的侵襲。東北部是歐巴馬的大本營之一,如果該地區人民因為風災而受影響無法投票,歐巴馬損失的票將遠大於羅姆尼損失的票。因此如果光算全民投票的票數,歐巴馬將受很大的影響,甚至可能因此從贏家變成輸家。

但是因為是採用這個選舉人制度,該地區雖然受影響,但兩陣營比例不變或變化不多,只是投票率減少,那不管票數是 1000:100 或是投票率減少後的 100:10, 並不影響誰在那幾州出線,對最後結果不會有影響。

可見,這樣的設計,可以減少因為區域性的天然災害或人為陰謀而影響大選結果的機率。

選舉人票分佈圖

由於所有州的選舉人票總共有 538 票(有一個網站叫做 fivethirtyeight 【3】),如果是兩個候選人,除以二是 269,當選門檻是 270 票(有一個網站叫做 (270towin 【4】)。下圖顯示美國這次大選選舉人票分佈圖 (資料來源【4】):


慣例是以藍色(民主黨的歐巴馬)、紅色(共和黨的羅姆尼)分別代表,可以視為『藍營』『紅營』的對決。

圖中我把中間垂直幾個州,從北邊靠加拿大的北達科大州到南邊的德州標示出來。這一整塊是美國最保守的州,從 1980 年代到現在 30 年間都是保守的共和黨的天下。民主黨的鐵票區則在西部海岸線及東北部。

本文參考資料中【5,6】兩個網站有很完整的,從美國開國到現在每一次總統選舉的『選舉人票分佈圖』。

如果選舉人票選不出總統

最後談到:如果在選舉人投票時投出 269:269 的平盤,那應該怎麼辦。這篇文章【2】講到,在這種情形下,總統人選將由國會(參議院+眾議院)選出。國會有很多席次在這次總統大選中跟著改選,新的國會在 2013 年第一個禮拜就職後從兩人中選出新總統。

紅色暴行的隱憂

了解上述這些選舉制度與時程,對觀察美國選情發展相當重要。尤其這次選舉被稱為美國有史以來兩極對立最嚴重的選舉【7,8】。已經有不少人在擔心選後可能會發生暴動 【9,10】,就跟台灣今年大選前一樣,尤其是如果歐巴馬輸了全民投票但贏得選舉人票而當選連任(這種情形的機會非常大)的時候。

如前所述,這種情形在 2000 曾發生過,雙方競爭激烈,最後,輸掉全民投票的共和黨小布希,因為贏得選舉人票而當選。那個時候的民調顯示:兩黨支持者中,如果對方陣營勝出而不服輸的比例,民主黨有 1/3,但共和黨卻有超過半數不願服輸【10】(有沒有想到國民黨?)。

那個時候比較傳統的溫和共和黨已經如此,這幾年共和黨可說是已經被極端的偏激保守派把持,共和黨員選輸不服輸的比例恐怕要遠高於12年前的 50%。因此選後像國民黨在 2004 年選輸上街鬧事,還有還有紅杉軍盤踞街頭的戲碼,有可能在美國由共和黨來上演而造成『紅暴』(red range 【10】)。


附錄:

假設的例子來說明在美國選制下,『全民投票贏但卻輸掉選舉人票』的可能性。假設一個國家有 A,B 兩個州。

A 有 1000 人口,選舉人票 10票。
B 有 200 人口,選舉人票 2 票。

投票總票數 1200, 選舉人票總數 12。由 X,Y 兩人競選,拿到 7 票或以上者當選。假設投票結果:
全民投票選舉人票
XYXY
A50149910-
B10190-2
總計511689102
%43%57%83%17%

雖然 Y 在全民投票中拿到 57%,最後卻是 X 當選。在決定最後勝負的計算過程中,那些在 A 州投給 Y 的 499 票完全沒有被考慮. X 在 A 州中只拿了 ~50% 的票,卻掌握 100% 的選舉人票。結果造成:獲得全國 57% 選票的 Y,只獲得 17% 的選舉人票。換個角度看:全國 57% 的人口只享有 17% 的權力,而 43% 的人口卻享有 83% 的權力。

參考: