序
混合模型(mixture model) 旨在密度估計、聚類資料(clustered data)、區別(discriminant) 分析,後來演變成「潛在類(unobserved classes) 迴歸預測」的工具。
混合模型框架提供了一個方便且靈活的方法來模擬複雜的異質(heterogeneous) 資料庫( 如生物學研究中通常會出現的資料集),例如:細胞計數數據和微陣列數據的分析、大型生物醫學資料集之減少維度、非對稱和非常態集群。有限混合模型(FMM) 早期應用在天文學(astronomy)、生物學(biology)、經濟學(economics)、工程學(engineering)、遺傳學(genetics)、市場行銷(marketing)、醫學(medicine)、精神病學(psychiatry),現已流行於教育學、心理學、社會科學、人管、生產管理、經濟系、風險管理系、航運管理、財務金融、會計、公共衛生、工業工程、土木⋯⋯。
本書有限混合模型(FMM),包括線性迴歸、次序迴歸、logistic 迴歸、多項logistic 迴歸、count 迴歸、零膨脹迴歸、參數型存活迴歸、2SLS 線性迴歸、order迴歸、Beta 迴歸等理論與實證研究。
本書第一章先介紹SAS、R 和SPSS 如何轉成STaTa,坊間常見的四十一種軟體及大型資料庫之檔案格式,都可轉至STaTa 來分析。STaTa 也是大數據分析很好的工具。
FMM 旨在「先求潛在分類(unobserved classes),再各類分別求其迴歸式」。
STaTa 提供十七種有限混合模型(FMM),僅logistic 迴歸的應用領域,就有下列十三種:
(1) 公共衛生領域:某傳染病的死亡因素。
(2) 生物醫學領域:癌症患者放射線治療對產生副作用、腎虛症與骨質疏鬆症關聯性、憂鬱症狀之影響因子等Logistic 分析⋯⋯。
(3) 工程類中的建物地震損害程度評估模型、絕緣礙子火花偵測系統。
(4) 商業領域:客戶關係管理、公司企業的存活;市場研究之消費者對特定商品購買時間、客戶忠誠度;或者商業上客戶資料管理、行銷、企業倒閉、員工離職。
(5) 財務金融領域:個人消費性貸款、法人金融預警分析等。
(6) 保險統計學及人口統計學中的投保與否。
(7) 社會學中的事件歷史分析,研究女性婚姻抉擇因素、高齡人口選擇未來養老居住方式⋯⋯。
(8) 法學研究:犯罪的因素等。
(9) 工業領域:可靠度分析、工業製成、產品cycle。
(10) 經濟研究:失業的因素,從就業時間到失業時間,到再就業時間等。
(11) 教育領域:老師離職、學生休退學/ 吸毒的因素等。
(12) 財管領域:財務危機與轉投資活動關係、貸款授信違約風險評估、銀行放款信用評等、應收帳款呆帳預測等。
(13) 行銷/ 企管類:旅客參與觀光旅遊線之消費型態、汽車保險續保、. 投資型保險商品購買預測等。
有鑑於STaTa 是地表最強統計軟體,故作者將撰寫一系列STaTa 的書籍,包括:
一、《STaTa 與高等統計分析的應用》一書,該書內容包括描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量⋯⋯。
二、《STaTa 在結構方程模型及試題反應理論》一書,該書內容包括路徑分析、結構方程模型、測量工具的信效度分析、因素分析⋯⋯。
三、《STaTa 在生物醫學統計分析》一書,該書內容包括類別資料分析( 無母數統計)、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研究資料、盛行率、發生率、相對危險率比、勝算比(odds ratio) 的計算、篩檢工具與ROC 曲線、工具變數(2SLS)⋯⋯Cox 比例危險模型、Kaplan-Meier 存活模型、脆弱性之Cox 模型、參數存活分析有六種模型、加速失敗時間模型、panel-data 存活模型、多層次存活模型⋯⋯
四、《Meta 統計分析實作:使用Excel 與CMA 程式》一書,該書內容包括統合分析(meta-analysis)、勝算比(odds ratio)、風險比、四種有名效果量(ES) 公式之單位變換等。
五、《Panel-data 迴歸模型:STaTa 在廣義時間序列的應用》一書,該書內容包括多層次模型、GEE、工具變數(2SLS)、動態模型⋯⋯。
六、《STaTa 在總體經濟與財務金融分析的應用》一書,該書內容包括誤差
異質性、動態模型、序列相關、時間序列分析、VAR、共整合等。
七、《多層次模型(HLM) 及重複測量:使用STaTaa》一書,該書內容包括線性多層次模型vs. 離散型多層次模型、計數型多層次模型、存活分析之多層次模型、非線性多層次模型⋯⋯。
八、《模糊多準評估法及統計》一書,該書內容包括AHP、ANP、TOPSIS、Fuzzy 理論、Fuzzy AHP 等理論與實作。
九、《邏輯斯迴歸及離散選擇模型:應用STaTa 統計》一書,該書內容包括邏輯斯迴歸 vs. 多元邏輯斯迴歸、配對資料的條件logistic 迴歸分析、multinomial logistic regression、特定方案Rank-ordered logistic 迴歸、零膨脹ordered probit regression迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logit model、離散選擇模型、多層次邏輯斯迴歸⋯⋯。
十、《有限混合模型(FMM):STaTa 分析( 以EM algorithm 做潛在分類再迴歸分析)》一書,該書內容包括FMM:線性迴歸、FMM:次序迴歸、FMM:Logit 迴歸、FMM:多項Logit 迴歸、FMM:零膨脹迴歸、FMM:參數型存活迴歸等理論與實作。
十一、《多變量統計:應用STaTa 分析》一書,該書內容包括MANOVA、囷素分析、典型相關、區別分析、MDS⋯⋯。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。本書內容結合「理論、方法、統計」,讓研究者能正確且精準使用STaTa,期望對產學界有拋磚引玉的效果。
最後,特別感謝全傑科技公司(www.softhome.com.tw) 提供STaTa 軟體,晚學才有機會撰寫STaTa 一系列的書籍,以嘉惠學習者。
張紹勳 敬上