拒絕「綵衣娛親」式的民調
隨著2018年11月底「九合一」選戰的到來,可以預見各種民調將陸續出籠。但最讓選民困惑的是,各民調結果常南轅北轍,媒體、學者或名嘴通稱這是所謂的「機構效應」。我大學讀統計系,所以最近常被朋友們問:什麼是「機構效應」。
談統計的書,給多數人的印象是很「悶」或「艱澀」。因此我特別推薦一本美國普渡大學(Purdue University)統計學教授大衛•摩爾(David Moore),以深入淺出方式,所寫的書--【統計的概念與爭議】(Statistics –Concepts and Controversies)。
他首先談到如何利用樣本來推估母體,以及在什麼條件下,其統計量(statistic)才能用來估計母體的參數(parameter)。
參數是用來描述母體的數字,但實際上我們無法知道;不過如果我們抽樣時遵守統計學邏輯,然後計算樣本的統計量,那就可用來推估母體的參數。
這個統計邏輯是,雖無法保證樣本一定能代表母體,但要用公平的方法來選擇樣本。也就是樣本必須是不偏(unbise)的,這就像打靶時,瞄準不能偏離靶心一樣。
要取得不偏樣本,首先是民調問題的設計不可刻意引導,讓其往特定的方向偏移。
其次是不能為方便,而使用「方便抽樣(convenience sampling)」或自發性回應樣本(voluntary reponse sample)。前者是選最容易取得的樣本,例如在特定場所隨意問經過的人們;後者例如電視call-in調查。因為用以上方式取得的樣本,都是偏向的。
要取得不偏樣本,可用簡單隨機抽樣(SRS)來取樣,因SRS符合:「抽樣時每個個體,被選入樣本的機率都相同」。
SRS的作法,步驟一是先將樣本中的個體,依所需的樣本數編碼。
其次是製作隨機數字表,該表滿足以下性質:
1、每個數字出現的機會一樣。
2、每個數字的出現,不會影響下個數字出現的機率。例如丟銅板實驗,由於銅板沒有記憶,所以它不會認為已經連續出現5次正面,所以下次「故意」出現反面。
步驟三是依據隨機數字表和樣本個體的編碼,進行抽樣。
以上SRS這些工作,現在都可設計程式,然後用電腦來執行。
簡單隨機抽樣雖解決瞄準偏離靶心的問題,但當我們從同一母體進行多次抽樣時,每次樣本統計量的值會隨之改變。這猶如多次射擊時,彈著點不可能打中同一點,這就是精確度問題。
不過抽樣分布(sampling distribution)原理告訴我們,大樣本的抽樣變異遠低於小樣本,所以足夠的樣本數可以解決精確度的問題。
根據以上的統計知識,嚴格的說「機構效應」並非科學名詞。真正的原因,應是這些民調中,有某些至少犯了:
1、 設計引導性問題。
2、採用方便抽樣、自發性回應抽樣或其他不當方法導致樣本偏向。
3、樣本太小,以致抽樣誤差太大,使得該統計量無法推估母體參數。
最等而下之的是製造假數字,或分析民調數字時濫用工具「拷打資料」,最後資料在「酷刑逼供」下「投降」了,給出政客想要的數字。
通常台灣戰略模擬學會(TASS)稱以上這些為討好政客,而刻意操作的民調為「綵衣娛親」式的民調。
今年的選戰,我們必須睜大眼睛,不要輕易相信「數字會說話」的文宣,也別再被「機構效應」這個名詞呼嚨,更應拒絕接受「綵衣娛親」式的民調。
同時也有2部Youtube影片,追蹤數超過12萬的網紅朱學恒的阿宅萬事通事務所,也在其Youtube影片中提到,Twitch傳送門: https://www.twitch.tv/otakuarmy2 不久之前在本頻道掀起了一場肛拭子之戰,我是一定要特別花時間討論的啊,根據紐約時報的報導,【上海復旦大學傳染病專家盧洪洲告訴官方小報《環球時報》,鼻拭子或咽拭子可能會造成「不適反應」,致使樣本不合格。他承認,糞便...
方便抽樣 在 朱學恒的阿宅萬事通事務所 Youtube 的精選貼文
Twitch傳送門: https://www.twitch.tv/otakuarmy2
不久之前在本頻道掀起了一場肛拭子之戰,我是一定要特別花時間討論的啊,根據紐約時報的報導,【上海復旦大學傳染病專家盧洪洲告訴官方小報《環球時報》,鼻拭子或咽拭子可能會造成「不適反應」,致使樣本不合格。他承認,糞便取樣可以代替肛拭子,以防止類似的不適。但其他專家——包括一些中國專家——對採集肛門樣本的必要性提出了質疑。《環球時報》援引另一位專家楊占秋的話說,鼻咽拭子仍然是最有效的,因為病毒是通過呼吸道感染的。香港大學公共衛生教授本傑明·考林(Benjamin Cowling)在接受採訪時表示,即使有人的肛門分泌物檢測呈陽性,但呼吸系統分泌物不是陽性,他或她的傳染性可能不會很大。】結果搞了半天我竟然在這個議題上跟胡錫進一樣立場【倒】,原因很簡單,肛拭子檢測絕對不是無可替代的檢測法,有鼻拭子、喉拭子,這些方法都比較快比較有效率,張開嘴巴採檢、戳鼻孔採檢難道會比脫褲子要來得久嗎?就算說是DELTA病毒株可以只在喉部存在比較多,那麼喉拭子也可以處理,甚至你堅持一定要看清楚消化道,那麼糞便樣本檢測也是可以,為何一定堅持肛拭子這種侵入性的檢測?更不要提反對肛拭子就是不科學這種說法了,哪有科學一定是要堅持侵入性檢測的?有人堅持肛溫比較準,那麼大家早上上班不量額溫,通通量肛溫是要怎麼運作?光排隊要排多久?
快篩方法從鼻、喉採集,進步到吐口水就可以檢測,就是一個科學的進步,在方便性和非侵入性上讓人們比較願意檢測。輝瑞的總裁Albert Bourla在受訪時就講過,如果不是因為研發時間太趕,應該要一劑就能夠達成免疫效果才符合科學和人類的需要。但就是因為研發時間不夠,才必須要暫時妥協。
德國之聲今年為了這個採訪了研究排洩物核酸檢測新冠病毒功效的專家——紐約蒙特菲奧醫學中心(Montefiore Medical Center)的微生物學家溫迪‧塞姆薩克(Wendy Szymczak)。【德國之聲:如果你要檢測一大批人,有什麼理由會讓你選擇肛拭子檢測,而不是我們所熟悉的方式?
塞姆薩克:我不認為可以只作肛拭子檢測。我想問題在於,既作鼻咽拭子,又作肛拭子檢測是否有意義?是為了要檢出那些上呼吸道已測不出病毒的漏網之魚嗎?這一點上,我不知道。這意味著大量的額外工作,需要大量的額外資源,對旅客來說造成很大的不便和不適。我們不知道這是否有必要。我們不清楚,如果(感染者)僅在糞便中排出病毒意味著什麼,他們是否會對其他人構成感染風險。】
科技始終來自於人性,要喜歡上肛拭子的人性太強烈了,我沒那麼強烈。好啦,花了這麼多時間檢討肛拭子的科學意義,我也真認真。
好了,那麼我們要花點時間討論林昶佐了。環南市場一役之後兵敗如山倒的昶佐今天又業力引爆了。如果他真的很兢兢業業地做事,不會落到這個下場,問題就是在於他作秀的比例遠遠高過做事的比例。今天的爆點是在於228國家紀念館首任館長、228受難家屬廖繼斌3日說,根據ETTODAY的報導:【這位自詡為228正義使者的歌手,在第6屆2年任期、15次的董事會中,「竟然只出席了第6次董事會,其他14次全部請假缺席!沒錯,就只出席了1次,翹班了14次!」這樣的出席率,不要說公家機關,就是發生在民間團體,也一定遭到同儕的冷眼與排斥。「林昶佐從今以後別再提228三個字好嗎?」廖繼斌痛批,「你每提一次,我們遺族心中就多淌血一次!」】
林昶佐荒謬的事情本來就不只這一樁,他以前就是特赦組織的台灣成員,但是在2016年內湖女童遭殘殺事件時,根據三立新聞2016年的報導:【台北內湖女童案震驚社會,廢死議題又再度引發討論,先前大力提倡廢死的時代力量立委林昶佐,昨(28)日受訪時絕口不提廢死,挨轟「烏龍繞桌」。時代力量今(29)早召開記者會,他對此再度回應,表示第一時間去辯論死刑存廢,會模糊了焦點,應該先照顧被害家屬的傷痛,而不是一味聚焦在支持或廢除死刑。】看看這甚麼屁話,遇到逆風時,昶佐就會先轉移焦點,說他甚麼立場不是重點,遇到有好處的時候挺身而出列在履歷上也絕無問題,這就是林昶佐啊,我跟他很熟啊!【笑】
根據聯合報七月四號的報導指出:【知情人士指出,政府要求原廠製造、直送,而且提供台積電、永齡的一千萬劑疫苗,標籤不會有「復必泰」,是應客製化要求重做,德國原廠必須啟動生產線另外供貨,由於德國原廠對疫苗的生產、抽樣、冷鏈、品管等程序要求嚴格,有一定的標準流程,何時第一批能完成到貨,只能說盡一切努力在完成合約簽署後能盡快將疫苗送抵國內。】 照這篇報導的說法,我國政府最堅持的就是標籤?這他媽的甚麼屁話,今天台灣死亡人數已經達到六百八十八人,結果是因為台灣才訂了特別生產線來生產,這個話不知道要說服誰?還有人對路透社放話透露消息,一時傳的天翻地覆,政府英明神武,好像都已經民調回升了。
然後還有三方同時放話給路透社的台北記者,其中一段更特別,【Another source said the German government, which has said it was trying to help Taiwan obtain the BioNTech vaccines, had been trying to speed up the talks.
"The German government doesn't want to leave the impression that they didn't sell vaccines to Taiwan due to the Chinese pressure, so it has been pushing the company to speed up its talks with Taiwan," the source said, referring to BioNTech.
The German Foreign Ministry declined to immediately comment.】啊這不就外交部自吹自擂的口吻,說德國政府有讓BNT加速跟台灣的談判。如果這是外交運作,可以為了搶功拿出來講嗎?如果不是為了搶功,以後德國政府是不是會被指責說只幫台灣不幫世界其他國家嗎?更別提這個放話獲得的德國外交部回應是,不予回應。更重要的是,德國駐台代表德國在台協會處長王子陶(Thomas Prinz)博士六月三號就說過了【我們注意到近來關於疫苗取得的爭議。請相信,德國政府,特別是聯邦經濟部部長Altmaier本人,對於台灣與BioNTech間持續的溝通協調,盡了好一番努力。然而,契約簽訂與否與條件,並非在政府的掌控下,而是取決於契約雙方。倘若契約雙方能夠達成共識,聯邦政府自然樂見其成。】這跟台灣放話德國政府介入談判差別是不是很大?
結果咧,郭台銘今天早上自己發布聲明特別強調,【路透引述知情人士報導指出,鴻海創辦人郭台銘、台積電與BNT代理商上海復星簽署購買疫苗的初步協議。郭台銘4日回應,轉載國際媒體無法證實的消息來源,可能妨害台灣取得疫苗的時程,呼籲勿臆測BNT疫苗採購進度,要大家別上當了!】到底是誰案子不確定的時候就想要收割,看看林昶佐,不會覺得這種動作很像是綠營農耕隊的作風嗎?
阿宅萬事通語錄貼圖上架囉 https://reurl.cc/dV7bmD
【加入YT會員按鈕】 https://reurl.cc/raleRb
【訂閱YT頻道按鈕】 https://reurl.cc/Q3k0g9
購買朱大衣服傳送門: https://shop.lucifer.tw/
方便抽樣 在 范琪斐 Youtube 的最讚貼文
歡迎收看范琪斐的寰宇漫遊,今天的琪斐大放送我們要來談談,2020美國總統大選民調一面倒的說拜登贏川普一大截,川貴人,這次別選了吧?乖~我待會給你買個....樓?大家好,我是范琪斐。中間偏右的《華爾街日報》(Wall Street Journal)聯手中間偏左的《國家廣播公司》(NBC),在「川拜」首場辯論後,到川普確診前這段時間,所做的民調顯示,拜登的支持率高達53%,足足領先川普14個百分點(53%:39%)。真的假的啦~這個幅度也太誇張,我們再參考一下別的。
(10/11公布)美國ABC News和《華盛頓郵報》(The Washington Post),在川普出院後做的最新民調,有54%的選民說會把票投給拜登,大幅領先川普12個百分點(54%:42%)。專門統計各家民調數據的Five Thirty Eight指出,拜登的平均支持率勝過川普10.4個百分點(52.2%:41.9%, 10/10數據)。另一個民調數據集合網站「真清晰政治」(Real Clear Politics)的網站顯示,從10月以來每一家主要民調公司統計出的結果,都是拜登遙遙領先川普,差距在5到16個百分點不等,其中不乏立場較為中間的The Hill和經濟學人。所以平均下來拜登的支持率領先9.8個百分點。(10/9公布)美國權威智庫與民調機構「皮尤研究中心」(Pew Research Center)做出來的結果是,52%的選民打算把票投給拜登,領先川普10個百分點(52%:42%)。
我們找了很多民調,可是只有很少數的說,川普領先拜登, 說很少數,是怕我們川貴人傷心,其實找來找去只有一個。 (10/5公布)英國《每日快報》聯手英美智庫Democracy Institute做的民調顯示,川普支持率在46%,小勝拜登1個百分點(46%:45%)。不過我還是註明一下,這個《每日快報》是英國的右翼八卦報,民主研究所的民調,也沒有被民調界公信力很高的538列入參考的近500家民調就是了, 所以現在大多數民調都顯示,拜登會獲得壓倒性勝利,但川貴人當然不認為他會選輸啊,最近又在那邊「Fake news」、「Fake polls」喊來喊去,民調統統都是假的!這都是幻覺~嚇不倒我的!
先不要笑,川貴人說的是真的,4年前一直到投票日當天早上,民調都還顯示希拉蕊一定會凍蒜,《紐約時報》做了大半年的民調,到選舉當天早上,還在說希拉蕊有80%以上的勝選機會,結果最後被「逆轉」,搖擺州統統被川貴人拿下!2016年的民調,被很多人認為是「壞掉了」、「走鐘了」,完全無法反映出真實民意,今年隨著大選日逼近,也有越來越多人開始質疑,真的假的啊?這幾年來專家們一直試圖釐清,當年的「希拉蕊慘案」到底是怎麼出現的,總之過去四年民調專家就很努力的要找出,民調為什麼會跟開出來的票差那麼多,但真的非常困難,因為變數實在太多了,我們今天就幫大家整理出幾個專家們認為可能的原因。
(一)手機的普及
還記得去年台灣不是在吵「手機民調要不要納入總統初選民調」嗎?美國其實也有類似的問題。美國現在就跟台灣「人手一機」一樣,有時候還兩三機,越來越少人使用家用電話了,而且年輕人、低收入者以及少數族群,都只用手機而已;反觀年長者和白人族群,就會比較依賴室內電話。大數據分析網站《Datanami》就指出,25歲左右的年輕人看到不認識的電話,幾乎都會pass不接;但70歲的長輩們則是每通必接,因此這樣進行的電話民調就很容易往某一族群傾斜。
那用手機民調不行嗎?根據1991年的《電話消費者保護法》(Telephone Consumer Protection Act of 1991;TCPA),美國是禁止「自動撥號系統」打電話給手機用戶的,所以如果要打手機做民調,就必須派出「真人」撥號,這有多麻煩呢?數據顯示,你想獲得1,000個回答,就至少得隨機撥號2萬次,其中大部分是空號,因為手機號碼是私人的,根本不會刊登在電話簿上,這實在太勞民傷財了,很想幫做民調的人馬殺雞一下耶,你們辛苦了。
(二)沉默的多數
每次選舉我都很期待接到民調電話,但大多數美國人可不是這麼想的,可能是因為擔憂個資和隱私外洩,導致選民接電話不敢說出真實意見,或者是覺得,蛤~民調很久欸,老娘才沒空理你。1970年代左右,美國「民調回應率」(Polls response rate)高達80%,你只要打過去人家多半都會回答你,但是根據「皮尤研究中心」最新報告,2018年美國「民調回應率」已經暴跌到6%,等於你打100通電話就只有6個人不掛你電話、願意花時間跟你聊兩句,但你也不知道他是不是講真話。
像2016年的大選,支持川普的選民中,就有一群選前不願意表態的,或者在接受民調時故意說謊的,有些甚至不告訴鄰居他們其實支持川普。《Datanami》表示,這些選民會讓調查的結果失準2%到6%,6%很多欸,根本就是超出誤差範圍了。
(三)網路民調難
啊現在網路那麼發達,用網路做民調不就統統搞定了嗎?事實上恐怕剛好相反。數據顯示美國18-29歲的年輕人,有98%都使用網路,但偏偏這個年齡層的人最不愛投票,拿美國總統大選風向球:2018年美國期中選舉為例,雖然這群年輕人投票率比前一次大幅提高15.7個百分點,但仍是所有年齡層中最低的(35.6%),也就是說,每個人都是「鍵盤投手」,大家網路上搖旗吶喊超熱情,結果投票日當天大家都覺得不差我這一票。另一方面,你在網路上想填幾歲就幾歲,想變性就變性,別國網軍想來帶風向,也不是那麼困難,因此網路民調也非常容易失準。
(四)早期民調誇大
另一個大變數是「早期民調」的準確度很低,因為選民還沒有足夠時間去瞭解候選人到底在幹嘛,但早期民調卻是媒體報導所仰賴的主要資訊來源,結果就是候選人拿來造勢、媒體見獵心喜誇大報導,進而影響到後續選民對候選人表示支持的聲量。例如看到拜登領先,那支持拜登的人講話就會比較大聲,因為他們是「主流」,反之支持川普的人,可能就會比較不敢表達意見,形成「沉默螺旋」。
「皮尤研究中心」也加碼解釋,事實上2016年的全國民調還算準確,(預測希贏3.3%最後贏2.1%),但美國總統大選是以選舉人票為單位,希拉蕊全國總票數高於川普也沒屁用,最後川普拿下所有的搖擺州,入主白宮。而選前的州民調也無法反映出搖擺州的真實民意,地方往往沒有全國性民調那種資源,四年前他們就忽略了在最後關頭,投給川普的搖擺選民數量,也沒有準確掌握未受過大學教育的白人選民,他們到底支持誰,種種因素導致了中西部上演「大驚奇」。還有就是民調公司往往有特定的政黨傾向,最後很可能導向「護主」的結果,讓民調不盡然客觀。
那這些問題2020年還會再重演嗎?老實說,有些變數還是很難避免,《紐約時報》就整理了,和四年前相比,哪些因素可能讓美國民調更精準或更失準。
更精準的第一點就是,搖擺選民減少了。
四年前民調失準的一大因素就是搖擺選民,但今年跟民調人員說:嗯~我還沒想好,的搖擺選民數量變少了,四年前的這個時候,大概還有20%的選民說他們還沒決定要投誰,或是打算投給小黨候選人,但今年這群人的數量只剩一半,而且其中支持川普的人也老早就表態,尤其是搖擺州的白人工人階級選民。
更精準的第二點是,選民教育程度的加權。
大家要有個概念,民調準不準確,完全取決於你抽樣有沒有做到「隨機」,也就是每個族群的意見都要被採納進來,但這真的非常難做到,最後很容易讓民調結果出現偏差。例如在美國,如果你跑去郊區教堂裡做民調,那幾乎可以篤定會獲得一個偏共和黨的結果;但如果你對大學生進行抽樣,最後很可能獲得一個偏民主黨的結果。另外的數據又顯示,受過高等教育的選民,比較願意接受民調訪問,每個都是選我選我~而那些較保守、教育程度較低的選民,他們的聲音就很難反映在民調上,所以如果你沒有按照「教育程度」來做加權,民調就會充斥太多年輕大學生的意見,導致結果偏向民主黨。先前民調機構都不怎麼重視教育程度對選情的影響,結果導致2016「爆冷門」。
有鑑於4年前的「教訓」,今年有越來越多民調機構,把選民教育程度的權重提高了,簡單來說就是把教育程度較高的受訪者音量降低一點,把教育程度較低的受訪者音量調高一點,讓他們各自符合在總人口中所佔的比例。今年從3月以來,美國各家民調機構做的幾十個調查中,已經有半數增加教育程度的權重,是先前的兩倍多(約20%)。
可能比2016年更糟糕的是,網路民調的增加。我們剛剛已經提過網路民調的準確度有待商榷,但過去幾個月來,越來越多機構採用網路民調的方式,比例佔地方民調總數的一半。他們採用的方法可能太過簡單,就是直接抓一群網路群組成員,然後再根據受訪者的人口統計資料進行分類加權,這樣的作法成本很低又很方便,但非常容易有樣本代表性不足的結果,而且最後民調可能左傾。 (最好的方式是結合電話民調和網路民調,例如AP/NORC/VoteCast的民調,電訪4萬人外加隨機抽樣11萬網友,結果可能較為客觀。
另一個可能不太客觀的做法是:請選民「回想投票」。
目前有越來越多投票機構採取這個方式,也就是要求受訪者回想2016年他把票投給誰,是希拉蕊還是川普呢?然後再依據他們的回答去做選舉意向的加權。這樣做可以讓民調數字看起來比較漂亮,也可以減少錯誤,但卻很難避免系統偏差,導致結果傾向某一政黨。再加上通常大家都會傾向回答,自己是投給獲勝的那一方,沒有人會想承認自己投給輸家嘛!再說這四年來誕生不少首投族,又有不少人往生,像是疫情導致那麼多人死亡,也有很多人搬到別的地方去,硬把2016年的投票意向套用到今年,恐怕不太合適。
所以這個民調到底是能不能看啊?你要是問我,我覺得就別看了 ,這是我們媒體想要預測選舉的結果, 或研究單位拿來做選民行為分析. 但一般選民還是把政策看清楚點比較要緊,你管別人怎麼投
今天琪斐大放送的關鍵字是:
#美民調失準
#選情霧茫茫
--------------------------------------
《#范琪斐的寰宇漫遊》每周四晚間8點55分在 #寰宇新聞台 播出,沒跟上的也沒關係,歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐的寰宇漫遊 🔔https://reurl.cc/ZvKM3 1000pm準時上傳完整版!
方便抽樣 在 便利抽樣英文在PTT/Dcard完整相關資訊 - 數位感 的推薦與評價
convenience samplingconvenience sampling - 便利抽樣- 國家教育研究院雙語詞彙terms.naer.edu.tw › detail關於精選摘要圖片全部顯示sampling method - 抽樣法- 國家 ... ... <看更多>
方便抽樣 在 便利抽樣英文在PTT/Dcard完整相關資訊 - 數位感 的推薦與評價
convenience samplingconvenience sampling - 便利抽樣- 國家教育研究院雙語詞彙terms.naer.edu.tw › detail關於精選摘要圖片全部顯示sampling method - 抽樣法- 國家 ... ... <看更多>
方便抽樣 在 每天簡單學社工- 【非機率抽樣】(Nonprobability sampling ... 的推薦與評價
便利抽樣在之前的例子裡已經舉過了經常用在街角的隨機訪問上面,有時候被稱為方便抽樣。 但在正式性的研究裡面,這種抽樣方法是非常危險的, 因為這種方式並無法讓抽樣的 ... ... <看更多>