隨著實證醫學的蓬勃發展,系統性產生並研究證據已成為一門顯學,而統計則是量化證據強弱的重要工具,但一般人對統計學教科書的既定印象,是充滿符號與公式的睡前最佳讀物,然而《簡明生物統計學》一書完全顛覆了這種想像。作者在書中用最少的公式、最多的圖像,以及用生動的例子帶領讀者瞭解抽象的統計概念,亦列出當今常見的統計觀念謬誤,有助於讀者在進行研究或批判文獻時的提示。本書同時包含理論觀念的建立與實務應用的重點摘要,對有志打下統計應用基礎的讀者及學習生物統計的學生來說,是一本不可多得的最佳教材。
序言:
我總認為自己是門外漢及麻煩製造者。在本書初版發表30年後,我懷著謙卑的心情準備第七版。本書的著眼點十分特殊:許多醫學文獻的論文存在可避免的錯誤。當時出版商McGraw-Hill深怕本書的「反抗性思維」會不受讀者歡迎,而對銷售量有負面影響;他們也擔心本書的架構與傳統的統計學課本不同。
時間已然證明,生物醫學領域已經準備好要接受這種思維。本書獲得了非凡的成功。
然而近年來,醫學文獻的弊病與時俱進,而本書的內容也反映了該變化。許多期刊已經納入正式的統計審查,因此早年大行其道的低級錯誤已逐漸被「樣本偏誤」或「檢力不足」這類比較微妙的錯誤所取代(雖然現在不恰當的t檢定仍然不在少數)。本書的內容隨著時間不斷演化,包含了越來越多主題,例如檢力和樣本數,並增加了有關多重比較、相對風險、勝算比和存活分析的討論。
我在這一版刪減了有關多重比較檢定的討論,只聚焦在有母數和無母數方法的Bonferroni、Holm和Holm-Sidak校正檢定。
同時,這也是出版以來改動最徹底的一次再版。此版格式較寬、較開放,且舉例更多。另外,我還新增了多因子變異數分析、多重回歸和羅吉斯回歸*,更深入討論了實驗設計的議題、及如何整合數筆不同研究的資訊。實例和習題均經大刀闊斧的修改,且大多數來自21世紀發表的研究。
本書源於1973年,當時我擔任博士後研究員,有很多朋友和同事會向我請教生物統計的問題。由於他們的統計知識大都比我少,我試著學習如何幫助他們。我需要對多種檢定及統計方法做快速、直觀但正確的說明,因此漸漸衍生出一組制式的解釋,並作出一套關於生醫研究中常見的統計錯誤及克服之道的兩小時幻燈片。這些幻燈片相當成功,許多人建議我把它擴充成為生物統計的入門書,此 即1981年初版《簡明生物統計學》的濫觴。
因此,本書不僅是設計給單一的讀者—學生、博士後研究員、教授、臨床工作者—也適用於正式課程的學生。
本書可以作為各階段的教科書。它已成為醫學生必修的流行病學及生物統計課程中,生物統計部分的教科書。該課程用八堂一小時的課上完本書的前八章。本書也被我們學校的牙醫系選為精簡版生物統計課程的教材(只涵蓋前三章)。此外,對我(及其他人)來說,一季四學分的課程足以深入介紹整本書。該課程每週講課四小時,包含一小時的問題討論。來上課的學生身分很多元,從大學部到研究所及博士後研究員都有,有時候也會有教職員。
本書亦涵蓋了其他統計入門課程的技術性內容,因此可作為一般大學生統計導論課程(與醫學院教學內容的難度類似)的主要教材或補充教材,且特別適用於「想讓主修生命科學的學生和統計產生連結」的教師。
本書與其他生物統計入門教科書有幾點不同,這些差異是暢銷的主因。
首先,誤用t檢定分析多個組別的研究是常見的統計錯誤。這可能肇因於統計教科書中第一種「能產生眾所矚目之P值」的統計方法就是t檢定。即便書中有介紹變異數分析,也常常被放在最後面的章節,而於學期末被匆匆帶過或跳過。由於太多論文應該使用變異數分析,且變異數分析是所有有母數檢定的基礎,故我將其放在前面,然後再討論作為其特例的t檢定。第二,為了闡釋我在文獻中觀察到的弊病,書中也討論了多重比較檢定。第三,本書的架構與一般教科書不同,環繞著「假說檢定」及「估計治療效果的大小」。傳統教科書是從單一樣本、兩個樣本推廣到k個樣本的估計,以及假說檢定方法。我的方法針對的是閱讀或進行生物醫學研究時會切身遇到的問題。
大部分的例子來自文獻中有趣的研究,且盡可能地忠於原始資料。然而,我也稍微改編了某些原始資料,以便簡化統計問題(例如將樣本數改為一樣),讓我們可以將重點放在統計方法背後的重要直觀概念,而非複雜的代數和計算過程。我省略了(或僅間接提到)某些統計導論教科書的常見主題。我並未直接討論機率論及期望值,另外我還保持了P和α之間的模糊性。
和所有的書一樣,在此要向許多人致上誠摯的謝意。Julian Hoffman為我上了第一堂清楚且實用導向的生物統計課,讓我可以比向我諮詢的人更了解生物統計。這幾年來,Virgina Ernster、Susan Sacks、Philip Wilkinson、Marion Nestle、Mary Giammona、Bryan Slinker、Jim Lightwood、Kristina Thayer、Joaquin Barnoya、Jennifer Ibrahim和Sara Shain提供了一些很棒的實例,可納入本書的內容及習題。Bart Harvey和Evelyn Schlenker對於此版新增的內容提供了懇切的建議與詳盡的回饋,我十分感謝他們。最後要感謝的是使用本書的讀者、學生及生物統計教師,花時間寫信告訴我問題、意見與改善方法的建議。在準備第七版時,我盡我所能地留意他們的忠告。
本書的許多圖片直接來自我的幻燈片。事實上,讀這本書時,最好把它想像成印出來的幻燈片。大多數看過我幻燈片的人,在閱讀生物統計期刊時會更加嚴謹。許多讀過前幾版的人也有類似的回饋,這對我來說是無上的喜悅和滿足。希望本書能繼續讓更多人更嚴謹地處理資料,並幫助改善生醫文獻的品質,最終改善醫療照護的品質。
Stanton A. Glantz