引用本文: 李佳玲, 申文武, 羅利. 四川大學華西醫院呼吸科門診入院優先級決策影響因素的 Logistic 回歸分析. 中國循證醫學雜志, 2019, 19(1): 7-11. doi: 10.7507/1672-2531.201709113 復制
隨著社會經濟的發展,人們對醫療保健的需求不斷提高,雖然近十年大型綜合醫院床位數量不斷增加,但依然不能滿足民眾對醫療的需求,以三級醫院為代表的優質醫療資源的供給矛盾更加突出。同時,從疾病的嚴重程度及診療資源的獲得性與可及性來看,至少有 20% 的住院患者應在二級醫院接受治療,但卻在三級醫院就診,進一步加重了醫療資源供不應求的矛盾[1],從而出現大型綜合醫院一床難求的現象。為緩解這一矛盾,部分大型醫院成立了床位資源調配服務中心,希望通過不同優先級的入院排程模式,促進入院候床患者的分流[2]。
入院等候是患者和醫院都共同關注的重要問題,但是關于等候序列中患者優先級的研究卻大部分集中在手術[3, 4]、急診[5]和器官移植[6]等領域,而且涉及到的方法主要是綜合評價法[7]、數學規劃法[8]和仿真模型[9],通過專家獲取指標或構建模型來研究如何對候床患者進行優先級排序,而對入院排程的前端研究則較少。本文在已有研究的基礎上,關注入院環節的排程問題,并以四川大學華西醫院呼吸科門診就診與申請入院的患者信息為基礎,構建 Logistic 回歸模型,識別對患者入院有顯著影響的變量,并與現行的基于人工的入院排程規則進行對比,為今后大型綜合醫院入院排程提供決策依據。
1 資料與方法
1.1 資料來源
收集四川大學華西醫院呼吸科 2016 年 1 月 1 日到 2016 年 12 月 31 日入院患者的相關數據。由于急診患者往往比門診擇期患者優先入院,因此本文僅將擇期門診患者作為研究對象。刪除缺失值和異常值后總共 4 882 條字段,包括性別、年齡、門診診斷、登記入院時間、疾病類型等信息。
1.2 數據整理和清洗
將原始數據進行數據清洗和整理,共包含 9 個自變量,可分為三類:① 描述性統計信息,包括性別、年齡與醫保類型 3 個變量;② 時間信息,包含開入院證時間、申請入院時間、申請間隔時間(登記申請日期與開入院證日期的差值)和等候時間(實際入院日期與登記申請日期的差值)4 個變量;③ 疾病信息,包含疾病類型和收治等級 2 個變量。
1.3 統計分析
對原始數據進行整理和轉換之后,利用 R 軟件(開源軟件)進行數據分析和建模。以患者是否入院為因變量 Y(入院=1,未入院=0),9 個影響因素為自變量 X,使用 R 中的“glm 包”構建多因素 Logistic 回歸模型,探索呼吸科候床登記患者優先入院的影響因素。檢驗水準 α=0.001。
2 結果
2.1 數據整理和清洗結果
通過分析呼吸科疾病的主診斷編碼,將首字母相同的疾病分為一類,因本研究涉及的呼吸科疾病分類多達 17 個類別,根據專科醫護人員的意見,將首字母分別是 A、C、J、Z 的疾病單獨劃分為一類,把疾病類別中患病數較少的類別(編碼首字母為 B、D、E、F、H、I、K、M、N、Q、R、T)合并為第五類,因而得到 5 種疾病類型。根據呼吸科現有排程規則,分為 4 個優先級收治模式:等級 1(急重癥優先)、等級 2(專科病種優先)、等級 3(院外治療效果差的慢性病優先)、等級 4(其他疾病);等級越靠前,越應優先收治。數據變量、樣本的賦值和描述性信息見表 1。

2.2 Logistic 回歸分析結果
結果見表 2。由于本研究中涉及到的部分變量是類別變量,以年齡為例,年齡總共分為 4 個子類別,模型中自動以中年患者作為參照組,因而表 2 中關于年齡變量得到的結果是基于中年患者為參照的其余 3 個變量的回歸結果(模型 1)。Logistic 回歸模型結果顯示:醫保類型(城鄉)、入院申請時間(下午)、等候時間(連續變量)、疾病類型(類型 2、3、4、5)和收治等級(優先級 1、2、3)這 5 個自變量(及其子分類)均具有統計學意義。

我們將僅包含上述 5 個具有統計學意義的變量再次構建 Logistic 回歸模型(模型 2),并運用 anova 函數對包含全部 9 個變量的模型 1 和僅包含這五個變量的模型 2 進行方差分析。卡方檢驗結果顯示 P=0.489,說明模型 1 與模型 2 的擬合程度很好。同時采用線性回歸中的 R2來衡量模型的擬合效果(R2 范圍為 0 到 1 之間,越大說明擬合優度越高)。通過“BaylorEdPsych 包”來計算 Logistic 回歸模型的 R2 值。最后得到的矯正后 R2=0.690,說明僅包含 5 個變量的模型的擬合度較高。
在 Logistic 回歸中,響應變量是 Y=1 的對數優勢比(log)。回歸系數 β 是指當其他預測變量不變時,一單位預測變量的變化可引起的響應變量對數優勢比的變化。由于對數優勢比的可解釋性較差,因此我們對系數 β 進行指數化從而得到系數 Exp(β)[10]。Exp(β)>1(或 β>0),則表示在其他變量不變的情況下,隨著該初始變量值的增加,患者入院的概率發生比增加;反之,則減少。
描述性信息中醫保類型變量之間的差異具有統計學意義。醫保類型總共可以分為城鄉、城職、無醫保和其他類型,而結果顯示醫保類型中的城鄉類別對應的 Exp(β)為 0.370,表示在其他條件相同的情況下,醫保類型中城鄉患者入院的概率是城職患者的 0.370 倍。
時間信息中有 2 個變量在不同等級上的差異有統計學意義。入院申請時間分為上午和下午,根據系數顯示,在其他變量保持不變時,下午申請的患者入院的概率是上午的 0.531 倍。等候時間的 Exp(β)為 19.172,表示在其他條件相同的情況下,患者等候時間每增加一單位,則患者入院優勢比將乘以 19.172。
疾病信息中有 2 個變量在不同等級上的差異有統計學意義。疾病類型變量中,以類型 1 為參照物,其余疾病類型的入院概率差異均具有統計學意義。如類型 3 的 Exp(β)為 10.159,表示在其他條件相同的情況下,疾病屬于類型 3 的患者入院概率是類型 1 患者的 10.159 倍,其余疾病類型以此類推。疾病收治等級結果顯示,與收治優先級 4 相比,前面 3 個級別均具有顯著性差異。如優先級 1 的 Exp(β)為 13.927,表示收治等級為 1 的患者相比等級為 4 的患者入院概率要乘以 13.927,說明收治優先級越靠前越容易入院。
為更好地解釋表 2 的結果,我們繪制具有統計學差異的 4 種變量不同級別下的患者入院比例圖(由于等候時間是連續變量,故沒有計算入院比例)(圖 1)。

3 討論
本研究納入分析的初始變量 9 個,根據 Logistic 模型分析剔除了 4 個無關變量,從而得出 5 個有顯著統計學差異的變量。通過呼吸科入院排程的專家調研后,對結果進行解釋并給出對策建議。
疾病信息所得結果與專家入院排程過程一致。疾病信息中,2 個變量均有統計學差異:① 疾病類型。類型 1 所包含的疾病類型以肺結核病等常規呼吸系統疾病為主;類型 2 以肺惡性腫瘤、支氣管肺癌為主要疾病;類型 3 以急性肺部感染、肺纖維化、胸腔積液等急性病為主;類型 4 主要是關于惡性腫瘤術后放療;類型 5 主要是呼吸系統疾病類涉及到的其他疾病。圖 1 中疾病類型的入院比例與表 2 的回歸結果相符。以類型 1 普通呼吸系統疾病為參考物,在同等情況下類型 2、3、4(更多地涉及到惡性腫瘤)更容易入院。如對于類型 2 和 4,肺癌是呼吸系統主要的惡性腫瘤,部分肺癌患者在門診進行初診后,還需要入院檢查進行明確診斷以便及時進行根治性手術;同時惡性腫瘤患者進行基本醫療之后,為預防性醫療或鞏固療效以確保病情不再復發會選擇再次入院;而對于癌癥晚期患者更是需要定期入院接受化療及輔助治療,因此相比呼吸系統的其他疾病,肺癌入院率相對較高[11]。有文獻研究顯示肺癌已經是中國最常見的惡性腫瘤之一[12, 13],提示醫院在醫療資源有限的情況下,應該優先考慮收治此類重癥疾病患者。② 疾病的優先級。呼吸科患者既往排程規則是急重癥優先(大咯血、重癥哮喘、急性肺栓塞、氣胸等)、專科病種優先(肺部包塊或胸腔積液等需要做胸腔鏡進一步明確診斷、肺泡蛋白沉著癥需進行肺泡灌洗、氣道狹窄需安置支架等)、院外治療效果差的慢性病(COPD 和肺心病伴肺部感染或呼吸衰竭、支擴等)。本研究顯示,疾病的優先級變量結果與呼吸科既定的優先級規則相對應,說明大型綜合醫院在實際排程過程中,醫護人員嚴格遵循了以優先級和疾病的復雜程度為優先的規則,體現了醫院的戰略目標,維護了患者對優質醫療資源的公平可及性。
在時間信息變量中,關于入院申請時間和等候時間的結果與實際入院排程規則一致。說明在實際入院排程中,為了盡量減少患者的等候成本,排程專家通過綜合分析后,會讓疾病嚴重程度等其他條件相似的患者中等候時間長者優先入院,這一結果也進一步體現了優質資源獲取的公平性。而入院申請時間一方面是直接影響等候時間長短的重要因素;另一方面,基于醫院管理要求與工作習慣,出院事項的安排往往在當天下午,做第二天的預出院或第二天上午完成當天的臨時出院,根據患者到達醫院的路途耗時及減少床位資源臨時閑置的需求,入院服務中心根據當天預計出院情況電話預約患者在第二天具體的時間點辦理入院。在其他條件相同的情況下,上午登記的患者由于獲得當天臨時出院的床位資源的概率更高,從而相比下午登記的患者總體入院概率更高,這一結果與圖 1 一致。這提示醫院應當加強預出院管理,盡可能提升預出院比例,以進一步提升床位資源利用效率。
描述性統計信息中,僅醫保類型不同等級具有顯著的統計學差異。本文僅僅只使用了一個科室數據,因而得出的結果可能存在一定局限性。同時通過與呼吸科的醫師和入院中心的專家調研后,未發現對于入院率較低的城鄉醫保類型患者,是否是由于本人的意愿在等候期間放棄了入院,或分流到了其他醫院,又或是在入院篩選環節造成的差異等,后續建議進一步探討不同醫保類型患者的入院比例的差異性研究。
綜上所述,本文通過收集既往患者數據,建立 Logistic 回歸模型,從 9 個自變量中挖掘和分析出了 5 個影響入院排程的因素,并將現實的排程規則與本文結果進行對比,找出現有排程過程中的不足之處,有利于入院管理中以病種類型、疾病疑難復雜程度、需求來源類型等為依據,建立合理的入院優先級決策規則,為床位資源管理調度提供決策支持,確保患者入院排程的合理性與科學性[14, 15],有助于滿足患者需求并切實維護患者的切身利益,也有助于提高醫院整體診療水平和醫院整體績效,從而進一步緩解醫療資源絕對數量不足與相對浪費的矛盾[16]。但鑒于歷史數據的局限性,大型綜合醫院候床入院患者的優先級排程決策體系還有待于進一步從疾病類型、疾病惡化速率、修復難易程度、等待期間的資源消耗、科研貢獻值等多維度、多層面進行深入研究[3, 17]。
隨著社會經濟的發展,人們對醫療保健的需求不斷提高,雖然近十年大型綜合醫院床位數量不斷增加,但依然不能滿足民眾對醫療的需求,以三級醫院為代表的優質醫療資源的供給矛盾更加突出。同時,從疾病的嚴重程度及診療資源的獲得性與可及性來看,至少有 20% 的住院患者應在二級醫院接受治療,但卻在三級醫院就診,進一步加重了醫療資源供不應求的矛盾[1],從而出現大型綜合醫院一床難求的現象。為緩解這一矛盾,部分大型醫院成立了床位資源調配服務中心,希望通過不同優先級的入院排程模式,促進入院候床患者的分流[2]。
入院等候是患者和醫院都共同關注的重要問題,但是關于等候序列中患者優先級的研究卻大部分集中在手術[3, 4]、急診[5]和器官移植[6]等領域,而且涉及到的方法主要是綜合評價法[7]、數學規劃法[8]和仿真模型[9],通過專家獲取指標或構建模型來研究如何對候床患者進行優先級排序,而對入院排程的前端研究則較少。本文在已有研究的基礎上,關注入院環節的排程問題,并以四川大學華西醫院呼吸科門診就診與申請入院的患者信息為基礎,構建 Logistic 回歸模型,識別對患者入院有顯著影響的變量,并與現行的基于人工的入院排程規則進行對比,為今后大型綜合醫院入院排程提供決策依據。
1 資料與方法
1.1 資料來源
收集四川大學華西醫院呼吸科 2016 年 1 月 1 日到 2016 年 12 月 31 日入院患者的相關數據。由于急診患者往往比門診擇期患者優先入院,因此本文僅將擇期門診患者作為研究對象。刪除缺失值和異常值后總共 4 882 條字段,包括性別、年齡、門診診斷、登記入院時間、疾病類型等信息。
1.2 數據整理和清洗
將原始數據進行數據清洗和整理,共包含 9 個自變量,可分為三類:① 描述性統計信息,包括性別、年齡與醫保類型 3 個變量;② 時間信息,包含開入院證時間、申請入院時間、申請間隔時間(登記申請日期與開入院證日期的差值)和等候時間(實際入院日期與登記申請日期的差值)4 個變量;③ 疾病信息,包含疾病類型和收治等級 2 個變量。
1.3 統計分析
對原始數據進行整理和轉換之后,利用 R 軟件(開源軟件)進行數據分析和建模。以患者是否入院為因變量 Y(入院=1,未入院=0),9 個影響因素為自變量 X,使用 R 中的“glm 包”構建多因素 Logistic 回歸模型,探索呼吸科候床登記患者優先入院的影響因素。檢驗水準 α=0.001。
2 結果
2.1 數據整理和清洗結果
通過分析呼吸科疾病的主診斷編碼,將首字母相同的疾病分為一類,因本研究涉及的呼吸科疾病分類多達 17 個類別,根據專科醫護人員的意見,將首字母分別是 A、C、J、Z 的疾病單獨劃分為一類,把疾病類別中患病數較少的類別(編碼首字母為 B、D、E、F、H、I、K、M、N、Q、R、T)合并為第五類,因而得到 5 種疾病類型。根據呼吸科現有排程規則,分為 4 個優先級收治模式:等級 1(急重癥優先)、等級 2(專科病種優先)、等級 3(院外治療效果差的慢性病優先)、等級 4(其他疾病);等級越靠前,越應優先收治。數據變量、樣本的賦值和描述性信息見表 1。

2.2 Logistic 回歸分析結果
結果見表 2。由于本研究中涉及到的部分變量是類別變量,以年齡為例,年齡總共分為 4 個子類別,模型中自動以中年患者作為參照組,因而表 2 中關于年齡變量得到的結果是基于中年患者為參照的其余 3 個變量的回歸結果(模型 1)。Logistic 回歸模型結果顯示:醫保類型(城鄉)、入院申請時間(下午)、等候時間(連續變量)、疾病類型(類型 2、3、4、5)和收治等級(優先級 1、2、3)這 5 個自變量(及其子分類)均具有統計學意義。

我們將僅包含上述 5 個具有統計學意義的變量再次構建 Logistic 回歸模型(模型 2),并運用 anova 函數對包含全部 9 個變量的模型 1 和僅包含這五個變量的模型 2 進行方差分析。卡方檢驗結果顯示 P=0.489,說明模型 1 與模型 2 的擬合程度很好。同時采用線性回歸中的 R2來衡量模型的擬合效果(R2 范圍為 0 到 1 之間,越大說明擬合優度越高)。通過“BaylorEdPsych 包”來計算 Logistic 回歸模型的 R2 值。最后得到的矯正后 R2=0.690,說明僅包含 5 個變量的模型的擬合度較高。
在 Logistic 回歸中,響應變量是 Y=1 的對數優勢比(log)。回歸系數 β 是指當其他預測變量不變時,一單位預測變量的變化可引起的響應變量對數優勢比的變化。由于對數優勢比的可解釋性較差,因此我們對系數 β 進行指數化從而得到系數 Exp(β)[10]。Exp(β)>1(或 β>0),則表示在其他變量不變的情況下,隨著該初始變量值的增加,患者入院的概率發生比增加;反之,則減少。
描述性信息中醫保類型變量之間的差異具有統計學意義。醫保類型總共可以分為城鄉、城職、無醫保和其他類型,而結果顯示醫保類型中的城鄉類別對應的 Exp(β)為 0.370,表示在其他條件相同的情況下,醫保類型中城鄉患者入院的概率是城職患者的 0.370 倍。
時間信息中有 2 個變量在不同等級上的差異有統計學意義。入院申請時間分為上午和下午,根據系數顯示,在其他變量保持不變時,下午申請的患者入院的概率是上午的 0.531 倍。等候時間的 Exp(β)為 19.172,表示在其他條件相同的情況下,患者等候時間每增加一單位,則患者入院優勢比將乘以 19.172。
疾病信息中有 2 個變量在不同等級上的差異有統計學意義。疾病類型變量中,以類型 1 為參照物,其余疾病類型的入院概率差異均具有統計學意義。如類型 3 的 Exp(β)為 10.159,表示在其他條件相同的情況下,疾病屬于類型 3 的患者入院概率是類型 1 患者的 10.159 倍,其余疾病類型以此類推。疾病收治等級結果顯示,與收治優先級 4 相比,前面 3 個級別均具有顯著性差異。如優先級 1 的 Exp(β)為 13.927,表示收治等級為 1 的患者相比等級為 4 的患者入院概率要乘以 13.927,說明收治優先級越靠前越容易入院。
為更好地解釋表 2 的結果,我們繪制具有統計學差異的 4 種變量不同級別下的患者入院比例圖(由于等候時間是連續變量,故沒有計算入院比例)(圖 1)。

3 討論
本研究納入分析的初始變量 9 個,根據 Logistic 模型分析剔除了 4 個無關變量,從而得出 5 個有顯著統計學差異的變量。通過呼吸科入院排程的專家調研后,對結果進行解釋并給出對策建議。
疾病信息所得結果與專家入院排程過程一致。疾病信息中,2 個變量均有統計學差異:① 疾病類型。類型 1 所包含的疾病類型以肺結核病等常規呼吸系統疾病為主;類型 2 以肺惡性腫瘤、支氣管肺癌為主要疾病;類型 3 以急性肺部感染、肺纖維化、胸腔積液等急性病為主;類型 4 主要是關于惡性腫瘤術后放療;類型 5 主要是呼吸系統疾病類涉及到的其他疾病。圖 1 中疾病類型的入院比例與表 2 的回歸結果相符。以類型 1 普通呼吸系統疾病為參考物,在同等情況下類型 2、3、4(更多地涉及到惡性腫瘤)更容易入院。如對于類型 2 和 4,肺癌是呼吸系統主要的惡性腫瘤,部分肺癌患者在門診進行初診后,還需要入院檢查進行明確診斷以便及時進行根治性手術;同時惡性腫瘤患者進行基本醫療之后,為預防性醫療或鞏固療效以確保病情不再復發會選擇再次入院;而對于癌癥晚期患者更是需要定期入院接受化療及輔助治療,因此相比呼吸系統的其他疾病,肺癌入院率相對較高[11]。有文獻研究顯示肺癌已經是中國最常見的惡性腫瘤之一[12, 13],提示醫院在醫療資源有限的情況下,應該優先考慮收治此類重癥疾病患者。② 疾病的優先級。呼吸科患者既往排程規則是急重癥優先(大咯血、重癥哮喘、急性肺栓塞、氣胸等)、專科病種優先(肺部包塊或胸腔積液等需要做胸腔鏡進一步明確診斷、肺泡蛋白沉著癥需進行肺泡灌洗、氣道狹窄需安置支架等)、院外治療效果差的慢性病(COPD 和肺心病伴肺部感染或呼吸衰竭、支擴等)。本研究顯示,疾病的優先級變量結果與呼吸科既定的優先級規則相對應,說明大型綜合醫院在實際排程過程中,醫護人員嚴格遵循了以優先級和疾病的復雜程度為優先的規則,體現了醫院的戰略目標,維護了患者對優質醫療資源的公平可及性。
在時間信息變量中,關于入院申請時間和等候時間的結果與實際入院排程規則一致。說明在實際入院排程中,為了盡量減少患者的等候成本,排程專家通過綜合分析后,會讓疾病嚴重程度等其他條件相似的患者中等候時間長者優先入院,這一結果也進一步體現了優質資源獲取的公平性。而入院申請時間一方面是直接影響等候時間長短的重要因素;另一方面,基于醫院管理要求與工作習慣,出院事項的安排往往在當天下午,做第二天的預出院或第二天上午完成當天的臨時出院,根據患者到達醫院的路途耗時及減少床位資源臨時閑置的需求,入院服務中心根據當天預計出院情況電話預約患者在第二天具體的時間點辦理入院。在其他條件相同的情況下,上午登記的患者由于獲得當天臨時出院的床位資源的概率更高,從而相比下午登記的患者總體入院概率更高,這一結果與圖 1 一致。這提示醫院應當加強預出院管理,盡可能提升預出院比例,以進一步提升床位資源利用效率。
描述性統計信息中,僅醫保類型不同等級具有顯著的統計學差異。本文僅僅只使用了一個科室數據,因而得出的結果可能存在一定局限性。同時通過與呼吸科的醫師和入院中心的專家調研后,未發現對于入院率較低的城鄉醫保類型患者,是否是由于本人的意愿在等候期間放棄了入院,或分流到了其他醫院,又或是在入院篩選環節造成的差異等,后續建議進一步探討不同醫保類型患者的入院比例的差異性研究。
綜上所述,本文通過收集既往患者數據,建立 Logistic 回歸模型,從 9 個自變量中挖掘和分析出了 5 個影響入院排程的因素,并將現實的排程規則與本文結果進行對比,找出現有排程過程中的不足之處,有利于入院管理中以病種類型、疾病疑難復雜程度、需求來源類型等為依據,建立合理的入院優先級決策規則,為床位資源管理調度提供決策支持,確保患者入院排程的合理性與科學性[14, 15],有助于滿足患者需求并切實維護患者的切身利益,也有助于提高醫院整體診療水平和醫院整體績效,從而進一步緩解醫療資源絕對數量不足與相對浪費的矛盾[16]。但鑒于歷史數據的局限性,大型綜合醫院候床入院患者的優先級排程決策體系還有待于進一步從疾病類型、疾病惡化速率、修復難易程度、等待期間的資源消耗、科研貢獻值等多維度、多層面進行深入研究[3, 17]。