💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
「pragmatic意思」的推薦目錄:
- 關於pragmatic意思 在 蔡依橙的閱讀筆記 Facebook 的最讚貼文
- 關於pragmatic意思 在 新思惟國際 Facebook 的最佳解答
- 關於pragmatic意思 在 Facebook 的最讚貼文
- 關於pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的評價
- 關於pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的評價
- 關於pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的評價
- 關於pragmatic意思 在 A Pragmatic Approach to Assessing System Change - Overview 的評價
pragmatic意思 在 新思惟國際 Facebook 的最佳解答
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
pragmatic意思 在 Facebook 的最讚貼文
[點解球會咁鍾意換妻?]好,既然咁多人想睇,就寫巴塞,「而家搞到好大壓力」(真係麻撚煩)。講真我對自己寫文有信心(冇信心好意思叫人科水?),寫巴塞呢啲更加主要係睇外國文再整合消化,「你去鬧咪鬧原作者」。但你知球迷嘅嘢,本質同我呢啲「懶理性」鍵盤球評家係唔同嘅。
TLDR:我1億簽埃汾返嚟,對家又1億簽勞蘇返嚟。大家一個仙都唔使出,但,就大家都有盈利落袋!幾咁好!
==============
一週年!月頭訂最抵!比別人知得多。subscribe now(https://bityl.co/4Y0h)。Ivan Patreon,港美市場評點,專題號外,每日一圖,好文推介。每星期6篇,月費100,已經1800人訂! 畀年費仲有85折,20/40年費VIP 送本人著作一本。
==============
1. 講明先,呢篇係上主菜前嘅小頭盤,主菜下篇,我食埋飯先寫。但呢個好小嘅故事,已經畀你睇到兩樣嘢:第一,巴塞早早已經財經唔多穩健(但球迷先唔會理呢啲),固然疫情冇人估到,但你見其他會情況冇咁差。你本身都危危地嘅,打多個浪埋嚟咪出事。第二,金融撚真係十分重要的。
2. 小故事(頭盤嘅頭盤!)第一:有冇聽過啲友恥笑話「GDP唔代表乜」?故事話兩個經濟學家,阿A同阿B講,你食咗舊狗屎,就畀10000蚊你,點知阿B真係食咗。然後阿B覺得蝕底,又同返阿A講,仲有一舊(唔好問我點解咁多屎),你食咗佢,我畀返10000蚊你,點知阿A又肯食。於是大家都冇嘢變過,兩個都食咗屎,但創造咗10000/20000蚊GDP — 呢個故事其實係有問題嘅,但唔係本文重點。
3. 小故事第二:我地將上面嘅故事演化下。兩間公司,小企鵝實業賣一個企鵝公仔畀勞蘇公司,明明街邊只係賣100蚊,但成交100萬。然後勞蘇公司又賣返個勞蘇公仔畀小企鵝實業,都係只係值100蚊,但成交100萬。實際上,兩間公司一個仙都唔使畀,只係換隻公仔。但,就齊齊都book咗99萬profit!畀你諗下,咁樣做得唔得?陣間答你。(預告:Depends)
4. 你有冇諗過,點解球會咁鍾意交換球員?如果打機嘅應該估到,「唔使畀錢」「又可以順手清垃圾」,但現實世界冇咁簡單,交換球員,仲有一個好重要嘅功能!
5. 之前巴塞嘅問題,下篇文解。但好快回帶去到,時間去到2020年夏天,疫情爆後不久,當時巴塞財政已經相當唔掂,急需要「平咗條數」,做到收支平衡。但,邊度變啲盈利出嚟?
6. 我唔知有冇人寫過,唔多覺,但當其時巴塞就有單令人相當費解嘅球員交易:由祖雲達斯簽入比真歷(Miralem Pjanić),然後以美路(Arthur Melo)交換。當時巴塞就用6000萬歐羅買比真歷,祖雲達斯就用7200萬歐羅買美路。
7. 我冇乜點睇波,唔知呢單交易在足球上make 唔make sense,但實際上,呢單交易99%都係為咗財政。填氹!唔只巴塞填,祖雲達斯都有得填,呢啲就win-win.諗出嚟嘅金融撚應記一功。
8. 冇錯,比真路同美路,應該唔係屎(嗰時菲臘比美路就真係屎!),但,角色咪等於勞蘇公仔同企鵝公仔!
9. 呢單買賣之後,巴塞咪有盈利!咪過到骨!係咪好神奇呢!
10. 講返,咁嘅操作得唔得?答案係,睇情況。渣正嚟講呢,你個auditor會質疑,喂,隻勞蘇公仔出面買100蚊咋喎,做乜你用100萬買?就算你嗰刻話「有人用呢個價買咪值」,但之後呢?你一轉手必定蝕到仆街,唔會有人用100萬接你隻勞蘇公仔。我當比真歷之類在巴塞終老,「一日唔賣一日都唔係蝕」,但,你每年做「折舊」都輸死你。你mark到咁貴嘛,你話100萬,咁隻勞蘇用10年(實情比真歷已經30歲),我咪每年同你「折舊」10萬,一樣之後出事
11. 但,公司又好,球會又好,群眾又好。有乜特色呀?短視咯。搞掂今年先算。我走後話撚知佢洪水滔天。下手自己搞掂。球迷一樣,咪撚同我講5年後爆煲,老子今年就要睇捧盃,之後嘅嘢之後先算。
12. 實際上,你隻勞蘇公仔當然唔可以估值100萬 —「除非係限量版」。真喎,藝術嘅嘢你識條撚?限量版,藝術嘢嚟呀,你啲分析員人地畫家個名都未識讀,憑乜質疑?呢個係嚟自意大利嘅無敵新名牌子,叫做ITALIANO加HE NO磨HIT池,你識乜?
13. 我可以話你知,實際上都係可以咁玩。你公司買個工廈單位(翠華?唔怕開名),總不能隔離單位賣緊3000蚊尺 你就mark 30萬一尺,你個海景無敵,咁我個海景唔使出嚟行啦?測量師唔會咁同你癲,你話mark 6000仲得,但唔好太過份(亦所以,有樣嘢叫做「特色單位」!)
14. 但,去到藝術品,就真係任你講了。你會計佬分析員點去質疑?咪唯有信「第三方估值」(實務上,就係大股東嘅炮兵團兄弟,或者情婦之類)
15. 咁球員,一樣!球員點估值?特別去到呢啲頂級嘅Level,你點質疑比路唔值7200萬?況且,好多球會都唔係上市公司(雖然祖雲達斯係),更加亂嚟,球迷亦唔會理。
16. 實際上,都有啲公司幫球員做估價嘅,例如Transfermarkt。咁我係球會咪話拎呢啲「獨立第三方」嘅估價。咁當然,就好多油水好多貓膩了。有利益就有古惑。
17. 留意,你用Transfermarkt嘅估值睇,當年比真歷同美路,都唔會值佢地買賣嘅價。但講真冇乜嘢,就算正常買賣都可以係咁。個重點係交換,大家都唔使出錢。
18. 呢類操作就係飲鴆止渴,你「貴價」買返嚟,之後咪又係要折舊write off,況且比真歷份糧你又要出,而個球員好似都冇乜點出過。但,搞掂一季先啦。
19. 故事講完,再講一次,巴塞點解會行到咁水深火熱,下篇文先講。但以上故事已經畀你見到,巴塞在舊年夏天,已經相當頭痕,先要搞啲咁嘅嘢。
20. 要講嘅係,本人唔係會計佬又唔係律師,但相信以上操作,99%都係合法合理,並唔係咩「洗黑錢」之類,頂多係法律邊緣,最古惑係「球員估值」呢下啫。亦絶對唔係巴塞首創,只係畀你見到,巴塞當時個情況都已經去到幾水深火熱。同埋,金融嘢真係十分重要,否則你永遠無法理解呢啲交易點解會出現。
21. 正文完晒。以下講嘅,只係個人感想,同巴塞興亡都冇乜大關係,唔鍾意唔使睇。勿鬧。
==================
22. 正如上面所講,你睇金融嘢真係幾咁緊要。丘世文(都死咗好多年)本身都係會計師,當時(都廿幾三十年前)佢在書中寫,中學應該必修會計。雖然我中四五有讀會計,大學都有選修過下(主要因為多女),但當其時我都覺得佢只係賣花讚花香,「同A Club啲讀者要求廿四小時播動畫差不多」
23. 但而家睇返,我十分同意佢嘅講法。等於而家話學生必修Coding咁,我覺得真係應該必修會計(定已經太遲?)。因為你諗下,我地真係生長在一個高度金融化嘅社會。唔係個個要做金融做會計從商,但你冇基本嘅知識,真係唔知個世界點運作。正如點解你要識英文。
24. 但,同好多人想像唔同,我並唔係咩覺得「乜撚都要講錢」。我係極之唔想見到足球(或好多嘢)咁商業化嘅。你諗真啲其實好合理,我成長嘅年代,足球仲係「未咁商業化」,保護主義,巴塞踢歐冠都只能出3個外援(好似係羅馬利奧,史岱哲哥夫,同埋朗奴高文)。
25. 只係因為「個世界已經變咗係咁」,我先照講。深層中我係個pragmatic 嘅人,個世界係咁運作我就話你知係咁運作,「應唔應該係咁」呢啲係另一個問題。
26. 事實上,亦因為咁,我係寧願睇國家隊。我捧德國嘅感情,多過任何一間球會,拜仁輸波我都唔會好大感覺。同我鍾意德國as a nation都唔係最大關係,最大關係係國家隊冇得買人!反而好玩的。(當然話完全冇商業化影響亦係自欺欺人,英格蘭國家隊都最後受惠於英超嘅成功)
27. 最最最後,自high講下,真係要睇唔同嘅嘢。呢個故事最初係Financial Times 講(其他媒體都有)。但,我係睇Bloomberg嘅Matt Levine(我個Patreon都受佢啟發),先再留意到。
28. 真係最後,而你亦見到,Financial Times同Bloomberg都要錢,都唔平。正如我個Patreon都要錢。但應該係咁的,「高度金融化嘅社會」嘛。寫得好,點解唔收錢?掉轉頭,唔收錢嘅,背後係乜?你可以諗下。
==============
一週年!月頭訂最抵!比別人知得多。subscribe now(https://bityl.co/4Y0h)。Ivan Patreon,港美市場評點,專題號外,每日一圖,好文推介。每星期6篇,月費100,已經1800人訂! 畀年費仲有85折,20/40年費VIP 送本人著作一本。
==============
pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的推薦與評價
2022pragmatic意思討論資訊,在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理,找pragmatic中文語言學,pragmatic中文語用,pragmatic meaning中文在Instagram影片與 ... ... <看更多>
pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的推薦與評價
2022pragmatic意思討論資訊,在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理,找pragmatic中文語言學,pragmatic中文語用,pragmatic meaning中文在Instagram影片與&nbsp;... ... <看更多>
pragmatic意思 在 pragmatic意思-在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理 的推薦與評價
2022pragmatic意思討論資訊,在PTT/MOBILE01/Dcard上的毛小孩推薦資訊整理,找pragmatic中文語言學,pragmatic中文語用,pragmatic meaning中文在Instagram影片與 ... ... <看更多>