內容簡介
本書特色:
●Stata功能強大,可以選單操作,也可自行輸入指令,能滿足初級者到高階者的需求。
●本書詳盡介紹生物醫學領域必學的分析技術,包含類別資料處理、存活分析、流行病學、病例控制、篩檢工具與ROC曲線等。
●實用範例資料檔,搭配視覺化操作說明,讓您迅速成為Stata統計高手。
●完整且札實的範例解析,幫助您觸類旁通,讓您的報告、論文大升級。
●由於電腦與統計的日新月異,使生醫統計也延伸至以下研究領域:生態、農業、商業、社會科學……
◎隨書附贈資料檔光碟,建議使用Stata 14版本執行。
----------
由於電腦硬體、軟體與統計方法的日新月異,使得統計學在生物醫學領域中,扮演舉足輕重的角色,本書內容主要為下列三大類:
一、類別資料處理。包括:二向列聯表、三向列聯表……等。
二、存活分析。包括:Kaplan-Meier、Cox迴歸、參數存活模型、危險比例檢定、時間共變數、韋伯分配、指數分配……等。存活分析的事件時間資料也常出現在其他不同領域中,如:企業存活時間(商業)、客戶忠誠度(行銷)、法人預警分析(金融)、再就業時間(經濟)、假釋到再犯時間(法學)和可靠度分析(工業)等等。
三、流行病學工具。包括:病例控制、Mantel-Haenszel、ROC分析……等。
Stata操作簡便,給予使用者足夠的自訂空間。不但可使用簡單的視窗指令,還能因應需求自行修改、添加或撰寫程式,擴充性極強。在運算速度上,也比SPSS及SAS更快。
本書是一本非常有用的Stata工具書,對初學或想領略高等統計的讀者,相信定有很大的收獲。
●Stata功能強大,可以選單操作,也可自行輸入指令,能滿足初級者到高階者的需求。
●本書詳盡介紹生物醫學領域必學的分析技術,包含類別資料處理、存活分析、流行病學、病例控制、篩檢工具與ROC曲線等。
●實用範例資料檔,搭配視覺化操作說明,讓您迅速成為Stata統計高手。
●完整且札實的範例解析,幫助您觸類旁通,讓您的報告、論文大升級。
●由於電腦與統計的日新月異,使生醫統計也延伸至以下研究領域:生態、農業、商業、社會科學……
◎隨書附贈資料檔光碟,建議使用Stata 14版本執行。
----------
由於電腦硬體、軟體與統計方法的日新月異,使得統計學在生物醫學領域中,扮演舉足輕重的角色,本書內容主要為下列三大類:
一、類別資料處理。包括:二向列聯表、三向列聯表……等。
二、存活分析。包括:Kaplan-Meier、Cox迴歸、參數存活模型、危險比例檢定、時間共變數、韋伯分配、指數分配……等。存活分析的事件時間資料也常出現在其他不同領域中,如:企業存活時間(商業)、客戶忠誠度(行銷)、法人預警分析(金融)、再就業時間(經濟)、假釋到再犯時間(法學)和可靠度分析(工業)等等。
三、流行病學工具。包括:病例控制、Mantel-Haenszel、ROC分析……等。
Stata操作簡便,給予使用者足夠的自訂空間。不但可使用簡單的視窗指令,還能因應需求自行修改、添加或撰寫程式,擴充性極強。在運算速度上,也比SPSS及SAS更快。
本書是一本非常有用的Stata工具書,對初學或想領略高等統計的讀者,相信定有很大的收獲。
作者簡介
張紹勳
學歷:國立政治大學資訊管理博士
現任:國立彰化師範大學專任教授
經歷:致理技術學院專任副教授
●研究助理
張任坊
國立海洋大學商船系
張博一
國立中央大學通訊工程研究所
學歷:國立政治大學資訊管理博士
現任:國立彰化師範大學專任教授
經歷:致理技術學院專任副教授
●研究助理
張任坊
國立海洋大學商船系
張博一
國立中央大學通訊工程研究所
內容目錄
Chapter 01 最小平方法(OLS) vs. 類別(Categorical) 資料分析
1-1 Stata是地表最強大之統計軟體
1-1-1 Stata統計功能
1-1-2 類別資料之列聯表,Stata對應的指令
1-1-3 Stata流行病(epidemiologists)之選擇表對應的指令
1-2 醫學實驗設計種類、重要性
1-2-1 流行病學的研究法:實驗性vs.觀察性
1-2-2 統計與實驗設計功能之對應關係
1-2-3 OLS迴歸模型之重點整理
1-2-4 單變量vs.多變量統計
1-3 二個類別變數之分析
1-3-1 類別變數之適用條件
1-3-2 卡方檢定:關聯性分析
1-3-2a 卡方檢定之介紹
1-3-2b 卡方檢定之Stata實作
1-3-3 勝算比(OR)、ROC曲線、敏感度/ 特異性:logistic迴歸
1-3-3a Odds ratio之意義
1-3-3b Odds ratio之STATA實作
1-3-3c 二元依變數之模型:邏輯斯迴歸之實例
1-3-3d ROC曲線面積、敏感度/ 特異性
1-4 流行病之類別資料統計表( 同質性檢定)
1-4-1 二發生率(Incidence-rate ratio)之列聯表(ir and iri指令)
1-4-2 世代研究風險比(Cohort study risk-ratio)之列聯表(cs、csi指令)
1-4-3 病例對照(case-control)列聯表(cc and cci、tabodds、mhodds指令)
1-4-4 分群組之失敗率(failure odds by category)列聯表(tabodds指令)
1-4-5 配對病例對照研究(matched case-control)(mcc、mcci指令)
1-5 三向列聯表(Three-Way Contingency Tables)
1-5-1 三向列聯表、Mantel-Haenszel同質性檢定(tab3way、cc指令)
1-6 類別依變數之三種迴歸,誰誤差小就誰優
1-6-1 類別依變數之三種迴歸,誰優?(reg、logit、probit指令)
1-7 對數線性模型(Log linear Models)之列聯表(ipf、「glm ..., fam(pois) link(log)」指令)
1-8 Nominal依變數:Multinomial Logistic迴歸之多項選擇(mlogit、mlogtest、test、prchange、listcoef指令)
1-8-1 Multinomial Logistic迴歸之解說
1-8-2 Multinomial Logistic迴歸之實作
1-9 配對資料(Matched Pairs)模型:Conditional logistic迴歸(先「clogit, group( 配對) or」指令、再tabulate指令)
1-10 Logit迴歸之練習題
Chapter 02 (半參數)Cox存活分析:臨床研究最重要統計法
2-1 存活分析(survival analysis)介紹
2-1-1 存活分析之定義
2-1-2 為何存活分析是臨床研究最重要的統計法?
2-1-3 存活分析之三種研究目標
2-1-4 存活分析之研究議題
2-1-5 設限資料(censored data)
2-1-6 存活時間T之機率函數
2-1-7 Cox存活分析vs. Logit模型/ probit模型的差異
2-2 Stata存活分析/ 繪圖表之對應指令、新增統計功能
2-3 存活分析範例:除草有助幼苗存活率嗎?
2-3-1 生命表(life table)
2-3-2 存活分析範例[依序(estat phtest、sts graph、ltable或sts list、stci、stmh、stcox指令)]
2-4 Cox比例危險模型(proportional hazards model)(stcox 指令)
2-4-1 f(t)機率密度函數、S(t)存活函數、h(t)危險函數、H(t)累積危險函數
2-4-2 Cox比例危險模型之迴歸式解說
2-4-3 危險函數的估計(hazard function)
2-4-4 Cox比例危險模型之配適度檢定
2-4-5 Cox模型之相對風險(relative risk, RR)
2-5 Kaplan-Meier存活模型
2-5-1 Kaplan-Meier估計法(product-limit Estimate)
2-5-2 存活分析法:Kaplan-Meier vs.韋伯分布(參數存活模型)
2-5-3 Kaplan-Meier存活函數(依序sts graph、ltable或sts list、stci、stmh、stcox指令)
2-5-4 存活分析之檢定法:Cox比例危險模型(stcox)指令
2-6 脆弱性之Cox模型(Cox regression with shared frailty)
2-6-1 脆弱性之Cox模型:「stcox, shared( 脆弱變數)」指令
Chapter 03 參數存活分析(偏態之依變數有6種分布可搭2種脆弱模型)
3-1 參數存活分析(parametric survival analysis)有六種模型
3-1-1a 可靠度之品質管理(韋伯分布常搭配accelerated failure-time)
3-1-1b Cox比例危險模型(PHM)及加速失敗時間模型(accelerated failure time, AFT)
3-1-2 參數存活分析之介紹(streg指令)
3-1-3 6種參數存活模型:韋伯及對數分布尚可搭2種脆弱模型(streg)
3-2 連續隨機變數(存活時間T)的6種機率密度函數(PDF)
3-2-1 機率密度函數(probability density function)
3-2-2 Weibull分布(非常態分布、右偏態):存活分析最重要分布
3-2-3 指數(Exponential) 分布:可靠度模型之失效時間的機率分布
3-2-4 Gompertz分布:偏態分布
3-2-5 對數邏輯分布(Log-logistic):偏態分布
3-2-6 對數常態(Log-normal)分布:偏態分布
3-2-7 廣義(generalized)gamma分布
3-3 存活時間機率函數(連續型態vs.離散型態)
3-3-1 連續型態之存活時間機率函數
3-3-2 離散型態之存活時間機率函數
3-4 帶偏態之依變數:參數存活分析(streg指令)
3-4-1 脆弱性(frailty) 模型
3-4-2 加速失敗時間(Accelerated Failure Time)模型
3-4-3 配對後Weibull存活模型搭配accelerated failure time:發電機壽命(streg指令)
3-4-4 每位病人發生多重失敗事件(multiple failures)之Weibull存活模型(streg指令)
3-4-5 五種參數模型(廣義Gamma、韋伯...),誰優?驗證治癌新藥效:(streg、test指令)
3-4-6 Weibull存活模型(帶有脆弱性gamma): 癌症死亡之個人因子(streg指令)
3-4-7 指數迴歸(搭配accelerated failure-time):肝癌之個人危險因子(streg指令)
Chapter 04 存活模型之進階
4-1 風險模型延伸(Extensions of the Proportional Hazards Model)
4-2 競爭風險迴歸(Competing-risks regression)(stcrreg指令)
4-2-1 競爭風險之應用:違約及提前清償行為模型係數估計
4-2-2 範例:競爭風險(Competing-risks)迴歸(stcrreg指令)
4-3 縱貫面調查法:肺癌存活模型(svy: stcox 指令)
4-4 panel-data參數存活模型[xtstreg , shared(panel變數)指令]
4-4-1 追蹤資料(panel-data)
4-4-2 追蹤資料(panel-data) 存活分析[xtstreg, shared (panel 變數) 指令]
4-5 多層次(multilevel)參數存活模型(mestreg指令)
4-5-1 Multilevel存活模型
4-5-2 多層次參數存活模型(mestreg...||分層變數)
Chapter 05 最小平方法(OLS)迴歸vs. Logistic迴歸
5-1 了解各類型迴歸分析
5-1-1 各類型迴歸之適用情境
5-1-2 線性迴歸之基本概念
5-2 最小平方法(OLS) 迴歸7個假定的診斷及補救法
5-3 Binary依變數:Linear Probability, Probit及Logistic迴歸
5-3-1 Logistic迴歸介紹
5-3-2 Logistic指令的事後檢定
5-3-3 Logistic範例:年齡與罹患冠心病(CHD)關係
5-4 Binary依變數(失業否預測):OLS,Probit及Logistic迴歸三者比較
Chapter 06 流行病學統計法:ROC曲線分析
6-1 流行病學(Epidemiology)
6-1-1 流行病學之研究法:觀察法及實驗法
6-1-2a 觀察法:描述性vs.分析性研究
6-1-2b 觀察法:前瞻性vs.回溯性研究;縱貫面vs.橫斷面研究
6-1-3 實驗法
6-1-4 Stata流行病(epidemiologists)之選擇表對應的指令
6-1-5 流行病學之ROC法的應用領域
6-1-6 臨床試驗常用術語解釋
6-1-7 頻率(frequency)的指標:生命統計測量值
6-2 Receiver operating characteristic(ROC)分析:判別檢驗工具的準確性
6-2-1 流行病統計法:ROC緣由
6-2-2 ROC曲線原理:2×2混淆矩陣
6-2-3a Type I誤差α及Type II誤差β:ROC圖切斷點的由來
1-1 Stata是地表最強大之統計軟體
1-1-1 Stata統計功能
1-1-2 類別資料之列聯表,Stata對應的指令
1-1-3 Stata流行病(epidemiologists)之選擇表對應的指令
1-2 醫學實驗設計種類、重要性
1-2-1 流行病學的研究法:實驗性vs.觀察性
1-2-2 統計與實驗設計功能之對應關係
1-2-3 OLS迴歸模型之重點整理
1-2-4 單變量vs.多變量統計
1-3 二個類別變數之分析
1-3-1 類別變數之適用條件
1-3-2 卡方檢定:關聯性分析
1-3-2a 卡方檢定之介紹
1-3-2b 卡方檢定之Stata實作
1-3-3 勝算比(OR)、ROC曲線、敏感度/ 特異性:logistic迴歸
1-3-3a Odds ratio之意義
1-3-3b Odds ratio之STATA實作
1-3-3c 二元依變數之模型:邏輯斯迴歸之實例
1-3-3d ROC曲線面積、敏感度/ 特異性
1-4 流行病之類別資料統計表( 同質性檢定)
1-4-1 二發生率(Incidence-rate ratio)之列聯表(ir and iri指令)
1-4-2 世代研究風險比(Cohort study risk-ratio)之列聯表(cs、csi指令)
1-4-3 病例對照(case-control)列聯表(cc and cci、tabodds、mhodds指令)
1-4-4 分群組之失敗率(failure odds by category)列聯表(tabodds指令)
1-4-5 配對病例對照研究(matched case-control)(mcc、mcci指令)
1-5 三向列聯表(Three-Way Contingency Tables)
1-5-1 三向列聯表、Mantel-Haenszel同質性檢定(tab3way、cc指令)
1-6 類別依變數之三種迴歸,誰誤差小就誰優
1-6-1 類別依變數之三種迴歸,誰優?(reg、logit、probit指令)
1-7 對數線性模型(Log linear Models)之列聯表(ipf、「glm ..., fam(pois) link(log)」指令)
1-8 Nominal依變數:Multinomial Logistic迴歸之多項選擇(mlogit、mlogtest、test、prchange、listcoef指令)
1-8-1 Multinomial Logistic迴歸之解說
1-8-2 Multinomial Logistic迴歸之實作
1-9 配對資料(Matched Pairs)模型:Conditional logistic迴歸(先「clogit, group( 配對) or」指令、再tabulate指令)
1-10 Logit迴歸之練習題
Chapter 02 (半參數)Cox存活分析:臨床研究最重要統計法
2-1 存活分析(survival analysis)介紹
2-1-1 存活分析之定義
2-1-2 為何存活分析是臨床研究最重要的統計法?
2-1-3 存活分析之三種研究目標
2-1-4 存活分析之研究議題
2-1-5 設限資料(censored data)
2-1-6 存活時間T之機率函數
2-1-7 Cox存活分析vs. Logit模型/ probit模型的差異
2-2 Stata存活分析/ 繪圖表之對應指令、新增統計功能
2-3 存活分析範例:除草有助幼苗存活率嗎?
2-3-1 生命表(life table)
2-3-2 存活分析範例[依序(estat phtest、sts graph、ltable或sts list、stci、stmh、stcox指令)]
2-4 Cox比例危險模型(proportional hazards model)(stcox 指令)
2-4-1 f(t)機率密度函數、S(t)存活函數、h(t)危險函數、H(t)累積危險函數
2-4-2 Cox比例危險模型之迴歸式解說
2-4-3 危險函數的估計(hazard function)
2-4-4 Cox比例危險模型之配適度檢定
2-4-5 Cox模型之相對風險(relative risk, RR)
2-5 Kaplan-Meier存活模型
2-5-1 Kaplan-Meier估計法(product-limit Estimate)
2-5-2 存活分析法:Kaplan-Meier vs.韋伯分布(參數存活模型)
2-5-3 Kaplan-Meier存活函數(依序sts graph、ltable或sts list、stci、stmh、stcox指令)
2-5-4 存活分析之檢定法:Cox比例危險模型(stcox)指令
2-6 脆弱性之Cox模型(Cox regression with shared frailty)
2-6-1 脆弱性之Cox模型:「stcox, shared( 脆弱變數)」指令
Chapter 03 參數存活分析(偏態之依變數有6種分布可搭2種脆弱模型)
3-1 參數存活分析(parametric survival analysis)有六種模型
3-1-1a 可靠度之品質管理(韋伯分布常搭配accelerated failure-time)
3-1-1b Cox比例危險模型(PHM)及加速失敗時間模型(accelerated failure time, AFT)
3-1-2 參數存活分析之介紹(streg指令)
3-1-3 6種參數存活模型:韋伯及對數分布尚可搭2種脆弱模型(streg)
3-2 連續隨機變數(存活時間T)的6種機率密度函數(PDF)
3-2-1 機率密度函數(probability density function)
3-2-2 Weibull分布(非常態分布、右偏態):存活分析最重要分布
3-2-3 指數(Exponential) 分布:可靠度模型之失效時間的機率分布
3-2-4 Gompertz分布:偏態分布
3-2-5 對數邏輯分布(Log-logistic):偏態分布
3-2-6 對數常態(Log-normal)分布:偏態分布
3-2-7 廣義(generalized)gamma分布
3-3 存活時間機率函數(連續型態vs.離散型態)
3-3-1 連續型態之存活時間機率函數
3-3-2 離散型態之存活時間機率函數
3-4 帶偏態之依變數:參數存活分析(streg指令)
3-4-1 脆弱性(frailty) 模型
3-4-2 加速失敗時間(Accelerated Failure Time)模型
3-4-3 配對後Weibull存活模型搭配accelerated failure time:發電機壽命(streg指令)
3-4-4 每位病人發生多重失敗事件(multiple failures)之Weibull存活模型(streg指令)
3-4-5 五種參數模型(廣義Gamma、韋伯...),誰優?驗證治癌新藥效:(streg、test指令)
3-4-6 Weibull存活模型(帶有脆弱性gamma): 癌症死亡之個人因子(streg指令)
3-4-7 指數迴歸(搭配accelerated failure-time):肝癌之個人危險因子(streg指令)
Chapter 04 存活模型之進階
4-1 風險模型延伸(Extensions of the Proportional Hazards Model)
4-2 競爭風險迴歸(Competing-risks regression)(stcrreg指令)
4-2-1 競爭風險之應用:違約及提前清償行為模型係數估計
4-2-2 範例:競爭風險(Competing-risks)迴歸(stcrreg指令)
4-3 縱貫面調查法:肺癌存活模型(svy: stcox 指令)
4-4 panel-data參數存活模型[xtstreg , shared(panel變數)指令]
4-4-1 追蹤資料(panel-data)
4-4-2 追蹤資料(panel-data) 存活分析[xtstreg, shared (panel 變數) 指令]
4-5 多層次(multilevel)參數存活模型(mestreg指令)
4-5-1 Multilevel存活模型
4-5-2 多層次參數存活模型(mestreg...||分層變數)
Chapter 05 最小平方法(OLS)迴歸vs. Logistic迴歸
5-1 了解各類型迴歸分析
5-1-1 各類型迴歸之適用情境
5-1-2 線性迴歸之基本概念
5-2 最小平方法(OLS) 迴歸7個假定的診斷及補救法
5-3 Binary依變數:Linear Probability, Probit及Logistic迴歸
5-3-1 Logistic迴歸介紹
5-3-2 Logistic指令的事後檢定
5-3-3 Logistic範例:年齡與罹患冠心病(CHD)關係
5-4 Binary依變數(失業否預測):OLS,Probit及Logistic迴歸三者比較
Chapter 06 流行病學統計法:ROC曲線分析
6-1 流行病學(Epidemiology)
6-1-1 流行病學之研究法:觀察法及實驗法
6-1-2a 觀察法:描述性vs.分析性研究
6-1-2b 觀察法:前瞻性vs.回溯性研究;縱貫面vs.橫斷面研究
6-1-3 實驗法
6-1-4 Stata流行病(epidemiologists)之選擇表對應的指令
6-1-5 流行病學之ROC法的應用領域
6-1-6 臨床試驗常用術語解釋
6-1-7 頻率(frequency)的指標:生命統計測量值
6-2 Receiver operating characteristic(ROC)分析:判別檢驗工具的準確性
6-2-1 流行病統計法:ROC緣由
6-2-2 ROC曲線原理:2×2混淆矩陣
6-2-3a Type I誤差α及Type II誤差β:ROC圖切斷點的由來