文獻解讀：結構方程模型SEM基礎，小白看這個就基本夠了

今天要解讀的依然是一篇教學文獻：The Basics of Structural Equation Modeling，文獻作者是Diana Suhr， Ph。D。 University of Northern Colorado。

文獻連結：https：//www。lexjansen。com/wuss/2006/tutorials/TUT-Suhr。pdf

結構方程模型是：

用來檢驗顯變數與潛變數關係假設的綜合性的統計技巧

用來表示，估計或者檢驗變數間理論關係的技巧

用來探究一系列潛變數和顯變數因果關係的統計技巧

我們做結構方程模型主要是為了：

瞭解變數之間的共變關係

解釋模型中變數儘可能多的變異

上面給出了結構方程模型比較宏大的概念，具體地我們又可以細分：

一般我們用SEM來解釋變數的變異或者變數之間的共變（variation and covariation）。我們用路徑分析探究變數之間的因果。我們用驗證性因子分析探究潛變數和顯變數之間的關係。我們用潛增長曲線模型（LGM）估計縱向資料的初始，變化，結構斜率和方差。上面提到的方法統統都可以歸於結構方程模型的特例。

結構方程模型和傳統分析方法的不同

首先SEM更加靈活，更加綜合。傳統方法的模型是提前規定的或者說是預設的，而做結構方程的時候，它對變數關係的限制幾乎沒有，需要你自己根據理論知識設定變數之間的關係；SEM既包含顯變數又有潛變數，而傳統的方法之分析顯變數；在SEM中我們認為誤差是存在的，你甚至可以規定不同變數之間誤差的關係，但是傳統的方法認為誤差是沒有的；傳統方法能夠輸出變數間關係的直接的顯著性檢驗結果，而SEM沒有這樣的結果，我們得用擬合指標來評價模型；結構方程模型可以很好地容忍多重共線性。

SEM的統計指標

chi-square：這個統計量表示預期協方差矩陣和資料的協方差矩陣的差異，卡方越小說明我們的模型和資料越符合。

Comparative Fit Index （CFI）：這個指標表示調整了樣本量後的ediscrepancy function，這個指標取值1~1，越大越好，建議大於0。9

Root Mean Square Error of Approximation （RMSEA）：這是一個和模型殘差有關的指標，越小越好，一般要求小於0。06

如果我們的模型做出來擬合指標還過的去，我們接下來就應該檢驗模型的引數，引數與其標準誤的比值是服從z分佈的，所以引數和其標準誤的比值大於1。96的話，這個引數的p就小於0。05。

當然啦，模型擬合指標不好的情況也是經常出現的，這個時候我們要很具合理的修正指數來修正我們的模型，比如你把原先固定的引數進行釋放等等。

做SEM之前你需要考慮

你的假設

樣本量：好一點的話就應該是估計引數的20倍，現實一點10倍就行，千萬不要小於5倍。

測量工具

多元正態性

引數識別

離群值和缺失值

模型擬合指數

做SEM的一般流程

首先你得有你的理論模型，根據這個理論來設定變數間的關係

設定模型，可以透過圖（AMOS）或者程式碼（lavaan，mplus）

判斷模型識別情況

明確模型變數的測量（就是明確問卷，或者自編條目）

收集資料

初始分析（缺失值、離群值的處理，標準化等）

估計模型引數

評估模型擬合情況

修正模型（如果有必要的話）

結果解釋寫作

上面的流程都是一家之言，你知道基本上做SEM就這些流程，具體不必非得按照上面這個順序，比如你可以再沒有收集資料之前就提前設定好模型，計劃好如何對潛變數進行測量，都是可以的。

SEM的各種標籤釋疑

令很多同學頭疼的問題之一就是一個SEM中各種名稱，這兒統一給大家總結一下：

自變數（Independent），預測因子（predictor），外生變數（exogenous （external））都是一個東西，在模型中都是去影響別的變數的。

因變數（Dependent），標準變數（criterion），內生變數（endogenous （internal））都是一個東西，表示別的變數的效果，在模型中受別的變數影響。

潛變數（Latent variable），因子（factor），構象（construct）都是一個東西，指你模型中的變數。

模型model

指的就是你研究的變數之間的關係的統計表達。

如果你想把你的模型直觀地畫出來，畫出來的這個東西就叫

路徑圖path diagram

模型設定Specification

就是指你對模型引數和整個模型的規定，這兒需要注意：

所有的模型都是錯的，沒有百分百吻合資料的模型，我們做SEM就是想要找到一個儘可能符合我們資料同時還符合理論解釋的通的模型。

我們對於模型引數的設定要麼是

固定

的，要麼是設定為

自由

的

固定引數Fixed parameters

就是指這個引數不從我們的資料中來估計，而是將它固定為0或者1。

自由引數Free parameters

是指需要模型從資料中估計的引數。

擬合指數Fit indices

反映模型擬合的如何，指的是我們設定固定和自由引數是不是和原始資料的方差協方差一致，chi-square， CFI， NNFI， RMSEA都是常見的擬合指數。

一個SEM可以劃分為兩個部分，一個部分叫做

測量模型measurement model

，指的是對潛變數和顯變數關係的設定，另一個叫做

結構模型structural model

，指的是潛變數間或者潛變數與其餘變數關係的設定。

識別Identification

模型識別的意思是對模型中的自由引數能否獲得一個特定的解，模型有解是需要滿足一定條件的：就是就是自由引數的個數q必須要小於或等於你的樣本協方差矩陣中非冗餘元素的個數p*，這個P*=p（p + 1）/2，其中p為測量變數的個數。

識別的型別

不識別underidentified

：就是從我們的資料中給一個或者多個引數找不出來一個特定的解。比如x + y = 5，這個xy可以來回變我們是找不到這個方程的特定解的，這個適合就叫做不識別，就是自由引數的個數q大於了獨立方程的個數。

恰好識別just identified：

就是對模型中的自由引數恰好可以從我們的資料中求得一個獨立的解，比如我們有方程組x + y = 5 and 2x + y = 8，這個時候xy剛剛好有一個解，但是恰好識別的情形下，模型是無法被檢驗的。

超識別overidentified：

就是我們可以從資料中給模型中自由引數估計很多個特定的值，比如我們有方程組x + y = 5， 2x + y = 8， and x + 2y = 9。這個方程本身也是無解的，但是我們可以定標準，然後求的特定的解，標準不一樣，解不一樣，所以這個情形模型是可以被檢驗的。

還有一個術語叫做

自由度df

，df = （p* - q），當自由度為正時，所有的自由引數都可以被估計。

我們做結構方程，就是為了在滿足我們本身資料結構和理論設定的情形下對自由引數進行估計。設定好不好，估計的準不準都得看模型擬合指標。

擬合指標

常規的Chi-square，這個東西叫做“badness-of-fit” index，我給翻譯為“擬合劣度指數”，所以卡方越小越好。

其他的各種CFI， NNFI……。。。等等各種指數都是擬合優度指數，越大越好。

兩個檢驗

一個叫做

Wald test

，這個檢驗是用來檢驗卡方改變數的，就是模型固定引數增加了之後模型擬合會不會顯著變壞。

另一個叫做

LaGrange Multiplier Test (LM)，

這個檢驗可以得到在釋放自由引數後模型的擬合會不會顯著變好。

模型修正Model modification

模型修正就是透過釋放固定引數，就是把模型中原先固定的引數進行自由估計以此來提高模型擬合。

路徑效應大小的判斷

判斷效應大小時，我們一定要看調整後的路徑係數，如果小於0。1就是小效應，0。3附近則為中效應，大於0。5為大效應。

SEM圖示

SEM中常見的圖示和解釋如下圖：

看幾個例子吧：

首先是迴歸模型：

上圖中就是3個自變數對一個因變數的迴歸的圖示。

上圖同樣是4個變數但是其中兩個變數對因變數有間接作用。像這樣的叫做中介模型。

上圖就是一個最簡單的結構方程了，有測量部分也有結構部分，但是結構部分是共變關係。

例項

原文獻中有SEM的例項和SAS軟體以及PROC CALIS軟體進行SEM分析的程式碼，因為自己不用這兩個軟體，所以不在我的文章中給大家寫了，感興趣自己去瞅瞅哈。

小結

今天給大家結構方程模型的粗淺的基礎知識，感謝大家耐心看完，自己的文章都寫的很細，程式碼都在原文中，希望大家都可以自己做一做，請關注後私信回覆“資料鏈接”獲取所有資料和本人收集的學習資料。如果對您有用請先收藏，再點贊轉發。

也歡迎大家的意見和建議，大家想了解什麼統計方法都可以在文章下留言，說不定我看見了就會給你寫教程哦。

如果你是一個大學本科生或研究生，如果你正在因為你的統計作業、資料分析、論文、報告、考試等發愁，如果你在使用SPSS，R，Python，Mplus， Excel中遇到任何問題，都可以聯絡我。因為我可以給您提供好的，詳細和耐心的資料分析服務。

如果你對Z檢驗，t檢驗，方差分析，多元方差分析，迴歸，卡方檢驗，相關，多水平模型，結構方程模型，中介調節，量表信效度等等統計技巧有任何問題，請私信我，獲取詳細和耐心的指導。

If you are a student and you are worried about you statistical #Assignments， #Data #Analysis， #Thesis， #reports， #composing， #Quizzes， Exams。。 And if you are facing problem in #SPSS， #R-Programming， #Excel， Mplus， then contact me。 Because I could provide you the best services for your Data Analysis。

Are you confused with statistical Techniques like z-test， t-test， ANOVA， MANOVA， Regression， Logistic Regression， Chi-Square， Correlation， Association， SEM， multilevel model， mediation and moderation etc。 for your Data Analysis。。。？？

Then Contact Me。 I will solve your Problem。。。

加油吧，打工人！

文獻解讀：結構方程模型SEM基礎，小白看這個就基本夠了

相關文章