【#請讓我先校正我自己-#認真解讀數字意義】下午我轉了則迷因段子,簡短地寫上了「喔別」。非關立場,我覺得這件事上我做錯了。在這邊我希望能道歉彌補,也透過這則貼文,回歸粉專該有的樣貌。
我做不對的地方是,當資訊複雜難消化,第一時間我該爬梳國際案例,比較目前幾種選項的執行優劣,同時也該嘗試徵集專家學者智慧,創造討論讓大家更安心,而不是創造對立。但上面那些我沒有做到,反而第一時間迷因式、鬆散地轉貼一則嘲諷式譬喻:這不僅不夠尊重辛苦的指揮中心和一線防疫人員,也不符合大家對粉專的期待:這不是現在社會所需要的。對不起我讓大家失望,希望透過這貼文,我自己先校正我自己,彙整資訊如下供討論。(感謝下午和我通過電話讓我詢問的醫師)✨
國際上,因為通報流程或採檢量能(或遇到國定假日),而造成官方數據與實際情況有時間差,這現象在英國、日本、美國華盛頓州、加州、亞利桑那州都發生過:台灣不是第一個面臨這種情況的國家。這在英文中被統稱為“#Backlog”,不只是管理數據或採集流程的問題,還有實驗室量能的問題。
【針對篩檢量能】,英國目前做法,是政府緊急在全國範圍內廣設測試站點,分散壓力,同時也增設移動型的測試點來輔助;而【針對數據統計和大眾溝通】,美國菁英型分析雜誌 The Atlantic〈大西洋〉,有兩位先鋒記者,去年找來一群基礎架構工程師和大數據科學家,結合Github與實體志工,發起一項稱為“The Covid Tracking Project”的聯合數據計畫。(連結放在留言處)
他們從一開始邀集志工手動輸入確診數據,到後來優化流程,把運行一年來的經驗公開分享。他們說到:「防疫工作、尤其在數據採集上,是複雜且消耗大量資源的。建立強大社區回報機制,第一時間公開透明是最終解方。」面臨時間差問題,他們採取幾個替代做法整理如下:
✨👉 (一)以 #移動平均值 為考量,而非看單一一天資訊👈✨
實際案例告訴他們,相較於在意「時間差」,更應該在意的是「時間差出現的延遲是否一致」。只要延遲 #合理一致 ,那數據就具有可信度。一年來的經驗之後他們寫下:「當疫情拉長,任何一個給定日期的數據,都會隨著時間推移而增加。」意思是,時間差造成的數據落差(或說校正回歸)就是會發生。只有當大批數據延遲的時間 #出現異常 才是需要注意的警訊。因此,要更多加注意的數據是「#移動平均值」,例如,從每7天或每14天平均值 #觀察趨勢,這會幫助大家解讀只從「一天」這個時間段看到的高低起伏。
✨👉 (二)#增添數據欄位 標示「數據未完整」或校正回歸。👈✨
當發生通報效率、採驗或流程問題時,如果當天採而來不及驗,他們建議增添數據欄位,直接在當天公開資訊庫標記 #數據統計未完整 data incomplete (probable cases)。最後檢驗完成時,也會再次在圖表上添加清楚筆記。綜合第一點,目前他們建議政府公開公布的圖表上面該有:*1) confirmed cases *2)incomplete (probable cases) *3)incomplete confirmed cases *4)total cases:7 days avg
*5)incomplete total cases:7 days avg 這幾個指標。
✨👉 (三) #更該加重關注陽性率解讀👈✨
林氏璧孔醫師每天衛教時間,一直在倡導的概念,和美國一年來的經驗是一致的。網站上也寫下認為我們更該關心PCR陽性率有沒有逐日下降。至於陽性率的採檢母體和認定標準,大家可以追蹤孔醫師粉專或是podcast,他有更專業的脈絡提供。先說結論,對照台灣數據,目前台灣陽性率的最高點落在5/15,當日是6.3%,陽性率之後有逐漸下降。
�
最後,為什麼會忽然出現這個說法呢?從大眾溝通的角度,今天指揮官陳時中說:「把這些案例歸在今天 #會造成很大的誤解,#對於疫情的判斷很不利,我們需要透過看每日採檢的陽性率,去研判需要採用措施的強度」
只是我感覺閱聽大眾在第一時間,忽然聽到新字眼「#校正回歸」似乎比較沒有心理準備。會冒出幾個的問題,例如今天的案例,會不會明天有校正回歸讓今天的案例攀升?我自己在第一時間聽到的心情是有些疑惑的。我很感謝大家對我的監督,督促我回歸有意義的討論溝通,我承諾下午那篇讓人誤會的迷因貼文減少發布,也請大家持續督促我🙏🙏。
那同樣的,我們是不是也可以溝通凝聚更多專業意見,讓政府和民眾流程更順暢,讓大家安心?如果大家有好的作法,或是看到國外案例分析參照,歡迎私訊或是留言給我。
最後的最後,再次感謝第一線辛苦的指揮中心和防疫人員,感謝你們辛勞和專業的付出。I don't say it enough.
希望大家平安。
增添數據欄位 在 和自動化,就此產生 - Facebook 的推薦與評價
... 而且工作流程只要改變,透過點擊滑鼠就可以自行定義或增添欄位,高的 ... 樂見的,再說到安全性,客戶數據保護與物理安全、災難備援、數據加密、 ... ... <看更多>
增添數據欄位 在 Comet ML - 你必須知道的ML 實驗管理神器 的推薦與評價
資料庫檢索功能(如欄位filtering,數值欄位排序…) 官方統一平台的實驗數據共享; 更多功能,像是corpus 及code 的版本控制、reproducibility ... ... <看更多>
增添數據欄位 在 Re: [問題] 請問為何非受迫性失誤跟致勝球查不到- 看板Tennis 的推薦與評價
ATP跟WTA網站的數據是從LIVE SCORE一分一分變動更新來的
原理是最古早的計分卡
以前主審坐在主審椅上就要不停畫卡
一分沒進也要畫、ACE、雙誤、得失分也要畫
範例: https://www.billiejeankingcup.com/media/321973/321973.pdf
現在主審有平板 一二發、得失分都是點一下平板
然後就會馬上連到官方app、官方網站、賭博網站給大家最新的比分資訊
同時可以兼顧即時性(球迷即時追蹤比賽最新狀況)和經濟性(不用額外花錢)
WINNER跟UE的計算是為了服務轉播觀眾
而且會牽扯到個人判斷(選手究竟有沒有碰到球、怎樣算是非受迫)
需要額外的轉播人力追蹤計算
所以只有大賽的電視轉播場地才會有
大賽很外圍的球場和一般250的比賽、甚至許多500的比賽
沒那麼多錢就沒有做這些數字
當然如果要做的比較完善的話
可以轉播結束之後再把這些人力計算的數字附進網站裡
但一來計算的場次不普及 沒有辦法有更進一步全面性的分析和比較
對ATP和WTA沒有任何附加利益
二來也要額外的人力再去增添欄位、補上這些數字
不像LIVE SCORE一樣主審按比賽結束就是一篇完整的報表
最後如果要做全面性統計的時候
(例如全年的一發進球率、全年的接發得分率、不同選手的數據對比)
還可能會面對到欄位格式的不同 增加計算的麻煩度
都是考量的原因
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.221.86.53 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Tennis/M.1647249498.A.CC5.html
... <看更多>