該文從醫院感染監測的信息化需求角度,闡述了醫院感染監測系統的分類及特點,介紹了監測統計數據中分子、分母的確定要求以及通過定期驗證檢查感染監測質量;在感染防控數據處理方面,介紹了機器學習的基本知識以及在感染防控領域的成果。機器學習方法或許會成為未來醫院感染自動化監測系統的主流算法,感染防控人員應學習相關知識,與計算機工程師和數據分析師合作,建立更加有效、合理、準確的監測系統,提升醫療機構醫院感染防控效果。
引用本文: 葛茂軍. 信息化時代的醫院感染預防與控制. 華西醫學, 2020, 35(3): 280-284. doi: 10.7507/1002-0179.202002006 復制
醫院監測感染并向臨床醫生和利益相關者反饋感染率,是醫療保健相關感染(healthcare-associated infection,HAI)防控質量改進的基礎。監測定義不同于臨床定義,監測定義用于判斷基線和發展趨勢,而臨床定義用于治療和預后[1]。因此,醫院感染預防與控制(以下簡稱“感控”)人員不能完全根據臨床定義進行醫院感染病例篩查。傳統的 HAI 監測是基于患者病歷的監測,需要大量人力查閱臨床病歷、結合微生物學報告或抗菌藥物使用數據等指標以及現場調查進行判斷[2],屬于勞動密集型工作,耗費大量時間。同時,傳統監測過多依賴監測人員發現感染病例的敏感性和特異性,也可能遺漏大量的感染[3-4]。例如,傳統的導管相關血流感染監測主要集中在重癥監護病房,而重癥監護病房外的導管數量可能更多,感控人員無暇按照重癥監護病房同樣標準監測。手工采集臨床信息的結果是“你看得越多,發現得越多”,而且在病例診斷時,可信度有限[5-8]。監測人員的努力程度決定了醫院感染病例發現的數量[8-9]。不同醫院實施的監測方案差異也會影響報告的感染率,如單一信息源篩查病歷(微生物學結果、抗菌藥物處方)可能導致漏報[10-11]。因此,有必要改變傳統的醫院感染監測方式,提高監測效率和成果。本文從信息化監測方面簡述感控信息化的進展,以此推進信息化時代的感控工作。
1 信息化監測
隨著計算機、存儲設備性能的提高(同等成本下,計算能力每 2 年翻一番)[12]以及電子病歷應用的普及,臨床大規模數據采集已不是問題,感控人員必須處理和解讀大量復雜的臨床數據信息,這些數據可以幫助感控人員更好地理解 HAI 發生的危險因素,改善危險分層,明確機構內、機構間的傳播途徑,提出針對性的防控措施[1]。但海量的數據、不斷增加的變量和多維度思考判斷超出了個人信息處理能力,感控人員越來越多地希望計算機來處理這些復雜任務。
1986 年鹽湖城 Latter Days Sants 醫院建立第一個利用微生物實驗室數據識別疑似 HAI 患者的計算機系統[9]。該系統根據定義標準篩查微生物實驗室報告并發出預警,感控人員收到報警后,再綜合其他信息,如病歷信息,判斷該警報是否歸類為 HAI。30 年來,醫院感染監測信息化建設不斷發展。
1.1 半自動監測和全自動監測
計算機執行部分監測(例如使用指定的標準查找病例),再由人工進行判斷的系統,屬于半自動監測系統;計算機完全根據監測定義進行自主判斷的系統屬于全自動監測系統[10]。二者的關鍵區別在于,HAI 病例的確定是由客觀的計算機算法決定,還是由感控人員手工審查原始數據確定[1]。
目前絕大多數感染預防項目使用的程序都是半自動監測系統,包括上文的 Latter Days Sants 監測系統。半自動監測系統過濾來自實驗室、藥房、入院系統的大量數據。它們需要用戶大量輸入數據,但無需核查病歷。這類系統在減少感控人員監測的時間方面很有價值,但由于人為因素,發現病例方面仍存在差異,且半自動監測系統設置中所使用的傳統定義不適合機構間比較[11]。理想的半自動電子監測具有很高的陰性預測值(即可靠地排除沒有 HAI 的患者)和合理的特異性[13],而理想的自動化監測系統要有高特異性和陽性預測值以避免假陽性[14]。Trick 等[15]在 2004 年描述了通過內部開發的算法成功自動監測導管相關血流感染。幾年之后,該系統擴展到 4 個醫療中心使用并得到驗證[16]。
1.2 信息化監測的變量
無論半自動監測還是全自動監測系統,HAI 監測的成功往往取決于數據的準確性、一致性和及時性[17]。這要求電子病歷系統必須提供準確、可靠的臨床數據,而且這些數據的標準化程度要足夠高。這些數據可以是臨床護理數據,如人口統計信息、診斷測試結果、微生物學結果、藥房記錄和其他臨床特征,也可以是管理數據,如《國際疾病分類》第 10 版代碼[18],還可以是直接反映患者情況的數據(如手術操作)和臨床醫生記錄的數據元素(如診斷、臨床體征和癥狀)。如果數據來源適合,臨床數據的敏感性和隨時間的一致性優于管理數據[19]。因為管理數據并不是為監測目的而來,利益競爭會影響編碼評判。一項研究甚至報告根據《國際疾病分類》第 10 版發現患者導尿管相關性尿路感染的敏感性僅有 2%[20]。
提高數據采集質量的方法包括盡量減少自由文本數據輸入和將文檔簡化為高度結構化、格式化的字段等。監測人員要評價數據質量和可用性,要深度理解為什么采集這些數據以及誰采集的這些數據[21]。如血液透析中心門診患者自動化監測遺漏很多血流感染,可能很大程度上是因為血液透析電子病歷中的血培養數據不能使用[22]。
1.2.1 評價公式中分母的確定
一般用感染率評價感控效果。評價公式中的分母是準確表達感染率的一個重要組成部分,通常用有效的高危患者例數、操作例數和/或天數表示。如手術部位感染的分母是手術次數,設備相關感染的分母是“設備使用天數”。但分母的復雜性往往被低估。對于導管相關血流感染監測,目前的標準是只要患者有中心靜脈導管,不管有多少根,每天都按 1 個設備記錄。對于手工監測,通常每天固定時間進行計數。電子監控可能會產生不同的結果,尤其是按照 24 h 內存在任何管路作為“設備使用天數”。感控人員應參與到監測系統的設計,這對于確定準確、一致地采集“設備使用天數”至關重要。有了足夠詳細的記錄,程序員把電子設備計數和手工設備計數間的差異降低到最小。此外,獲取每個設備的詳細信息將有助于醫療機構為未來監測定義的變化作好準備(如未來放置 2 根導管的患者可能統計為 2 個導管日,而不是 1 個)。能夠自動接收電子設備數據的監視系統可以極大地提高分母計算的效率和準確性。在確定設備相關的使用率時,通常需要能夠按病區捕獲患者的天數[1]。
1.2.2 評價公式中分子的確定
在傳統的監測中,感控人員通常會查閱詳細的床邊記錄和/或詢問治療醫生以獲取對病情的了解。但這些數據資源可能存在問題,如機構內數據的可用性存在差異;不同感控人員對病歷的解讀存在差異,有可能為支持一個假定的結果來尋找數據;詢問臨床醫生可能也不可靠,他們傾向提出自己主觀的臨床意見,而不是評估患者是否符合監測定義標準。感控人員在考慮將哪些數據作為分子時,必須考慮到電子病歷系統中數據的可用性、可訪問性以及這些附加數據是否會影響準確性和可靠性。數據可用性涉及到不同醫療機構間的工作流程和電子文檔處理過程是否一致。例如不同機構之間血培養采集方法相對一致,因此血液培養結果是高度可用的。數據可訪問性是指數據是否以易于訪問的格式存儲。可訪問性低的數據是指不易計算的記錄以及依賴文本處理來提取的數據,如放射科的圖片資料[1]。
美國衛生保健流行病學學會對不同醫院感染類型的電子病歷監測提出了基本數據要求,如中心導管相關感染監測應包含微生物培養結果(血培養和其他培養)、出入院記錄、存在中心靜脈導管等數據元;導尿管相關尿路感染監測應包含尿微生物培養結果、尿常規、出入院記錄、生命體征(發熱)、存在導尿管等數據元;手術部位感染監測應包含淺表或深部組織微生物培養結果、手術操作編碼(《國際疾病分類第九版臨床修訂本手術與操作》)、出入院記錄、抗菌藥物使用情況等數據元;呼吸機相關事件(呼吸機相關并發癥、感染相關并發癥)應包含呼吸機設置(呼氣末正壓、吸入氧濃度)、存在氣管插管、出入院記錄、抗菌藥物使用情況、生命體征(體溫)、實驗室檢查結果(白細胞)、微生物培養結果等數據元;多重耐藥菌和艱難梭菌監測應包含微生物培養結果和出入院記錄等數據元[1]。
1.2.3 驗證
驗證的目的是檢查感染監測質量。“判斷”感染的人為因素存在固有差異,傳統的驗證側重于提高人的可靠性。無論是全自動監測系統還是半自動監測系統都需要與參考標準(通常是手工監測)進行比較,提升監測效果的準確性。驗證是一個迭代過程,在采用新數據庫或新系統時更加需要驗證[4, 8, 23]。對于已采用電子化采集此類數據的機構,美國疾病預防控制中心推薦的分母驗證方法要求醫療機構電子設備計數誤差在人工計數的 5% 以內,在電子監測開始安裝時,需要進行 3 個月的驗證,以后每年進行 1 個月的持續驗證,電子監測系統應該能夠在患者級別生成設備計數的“驗證報告”,以便感控人員審核和排除差異[1]。
2 機器學習在感控領域的應用
完成監測數據采集后,如何有效分析這些數據,也是感控人員面臨的挑戰。在數據量較少時,微軟公司的 Excel 軟件可以滿足大部分感控統計的要求,但在自動化數據采集系統中,數據量和處理維度往往超過 Excel 處理能力,需要使用計算機語言進行分析。因此,感控人員要了解常用的計算機大數據處理的基本知識,指導軟件工程師進行數據處理。
計算機科學家創造了“大數據”這個術語,指數據量大、性質復雜、傳統數據處理方法無法有效分析的數據集,通常具有高容量(數據量)、高速度(數據進出速度)、多樣性(數據類型和來源范圍)和高準確性(準確性和正確性)等特性。大數據分析是指利用非傳統的先進方法對大數據進行分析,發現有價值信息的過程、方法和技術[24-25]。Upshur[26]認為目前的循證醫學臨床推理方法常常簡化臨床推理過程,而忽略了醫學的復雜性和細微差別,計算機算法可以作為指導或輔助臨床決策的手段。
機器學習是指計算機在不直接編程的情況下“學習”,通常集中用于 TB 級別、高維的數據集,強調預測的準確性,而不是假設驅動的推理[27]。與傳統的預測模型相比,機器學習更像是一種“黑箱”方法,即機器學習算法對預測變量的選擇不透明,甚至可能違反直覺[28]。常見的機器學習算法有人工神經網絡、決策樹、支持向量機、樸素貝葉斯和 k-means 聚類[26]。
機器學習可分為監督學習和無監督學習。監督學習類似于流行病學中標準的模型擬合類型,研究人員既要觀察輸入數據,也要觀察相應的目標值(即結果)。專業人員(如醫生)為每個樣本標注“標簽”,如患病或健康。學習的目標是找到最能區分這兩類樣本的模型,正確地將患病或健康的標簽分配給新的未被標記的樣本。常見的監督學習技術包括標準的流行病學方法,如線性邏輯回歸、決策樹、支持向量機和神經網絡等算法。在無監督學習中,訓練數據由一組輸入變量組成,沒有監督學習中需要的相應目標值(結果標簽)。無監督學習的目標是完全由數據驅動,在沒有任何專家標記的情況下發現模式并從數據中提取隱藏結構。典型的例子是聚類問題,目的是將相似的數據點分組在一起[29]。構建機器學習模型的核心要求是建立一個具有代表性、多樣化的數據集。理想的做法是用最接近實際使用過程的格式精確的高質量數據訓練模型[30]。機器學習方法已經用于感染性疾病的預測和預報。有研究人員利用谷歌搜索詞預測登革熱發病率是否超過監測標準[31]。還有研究人員通過 Twitter 數據在官方報告前 1~2 周預測流感樣疾病的水平[32]。
目前,機器學習在醫院感染監測數據處理方面已經取得成就。Oh 等[33]基于電子病歷回顧性研究了密歇根大學醫院和馬薩諸塞州總醫院的數據,利用機器學習構建具體醫院模型來估計患者艱難梭菌感染風險。該機器學習模型利用 15 萬成人患者數據建立并經內部驗證,結果顯示該算法具有較好的預測性能,曲線下面積為 0.75~0.82。該模型能在診斷艱難梭菌感染 5 d 前識別至少一半的真實陽性病例[28, 33]。Colborn 等[34]利用美國外科醫師學會國家外科質量監測中心數據建立了含有 136 個預測因子的模型,通過機器學習后,對科羅拉多大學醫院的手術患者預測手術部位感染,該模型的特異性達到 90%,敏感性達到 80%。Sanger 等[35]利用華盛頓大學醫學中心導尿管相關性尿路感染監測數據建立訓練數據集進行監測系統自然語言識別的機器學習,然后利用該系統前瞻性地對導尿患者進行導尿管相關性尿路感染識別,并與查閱病史判斷導尿管相關性尿路感染的金標準進行比較,該系統識別導尿管相關性尿路感染的敏感性為 97.1%,特異性為 94.5%,陽性預測值 66.7%,陰性預測值為 99.6%。Fujikura 等[36]利用耐萬古霉素腸球菌的全基因組測序結果與暴發患者的流行病學信息整合,利用貝葉斯分析方法重建耐萬古霉素腸球菌傳播路徑,結果顯示具有后驗概率的傳輸方向,揭示了環境表面傳播過程。Liao 等[37]利用電子鼻和呼吸機使用患者相關電子病歷數據,通過反向人工神經網絡分析和支持向量機方法預測銅綠假單胞菌致呼吸機相關性肺炎,兩種機器學習模型的曲線下面積分別達到 0.98 和 0.94,具有實際應用價值。從上述成功案例可以看出,機器學習的效率和處理數據的復雜程度超越傳統監測。同時為了達到更精準的預測和決策,實現成功的機器學習還需要大量設備數據進行支撐,超出了傳統監測數據采集范圍,這對未來監測數據采集規范和標準提出更高的要求。
機器學習的優勢是模型能識別數據中人類無法發現的數據模式,同時這也是它的弱點之一[30]。機器學習需要大量、多樣的數據集來提高模型的準確性[30],但如果輸入數據集出現了偏差,就會導致預測結果大相徑庭。微軟創建的人工智能 Twitter 聊天機器人,在“學習”人類文本 24 h 內就開始發布種族主義和種族滅絕推文[38]。因此,使用機器學習系統的臨床醫生和患者需要了解它們的局限性。此外,機器學習的另一個關鍵問題是如何平衡保護隱私的監管需求。感控人員要與互聯網技術專家和數據分析師進行有效溝通和合作,這樣才能充分挖掘醫療大數據的潛力;同時醫院流行病學家也要具備一些大數據分析技術的知識,尤其是機器學習方面的知識。機器學習并不是要取代標準統計分析或隨機對照試驗,而是為流行病學家提供了新的工具來解決經典方法不太適合解決的問題,但也絕不是解決研究設計或數據質量差的萬靈藥。
3 小結
感控人員不可能親自跟蹤每一名患者,醫生也不可能與所有可能需要治療的患者單獨互動。機器學習模型的成果可以輸出應用到專業知識欠缺或欠發達地區,直接提升這些地區的感染防控能力和專業水準。機器學習可在不涉及個人能力的情況下,給予感控人員專家級水平的指導。未來,區域或國家級別的數以億級的醫療數據將通過機器學習模型分析,為患者提供更加優質、安全的醫療服務。
醫院監測感染并向臨床醫生和利益相關者反饋感染率,是醫療保健相關感染(healthcare-associated infection,HAI)防控質量改進的基礎。監測定義不同于臨床定義,監測定義用于判斷基線和發展趨勢,而臨床定義用于治療和預后[1]。因此,醫院感染預防與控制(以下簡稱“感控”)人員不能完全根據臨床定義進行醫院感染病例篩查。傳統的 HAI 監測是基于患者病歷的監測,需要大量人力查閱臨床病歷、結合微生物學報告或抗菌藥物使用數據等指標以及現場調查進行判斷[2],屬于勞動密集型工作,耗費大量時間。同時,傳統監測過多依賴監測人員發現感染病例的敏感性和特異性,也可能遺漏大量的感染[3-4]。例如,傳統的導管相關血流感染監測主要集中在重癥監護病房,而重癥監護病房外的導管數量可能更多,感控人員無暇按照重癥監護病房同樣標準監測。手工采集臨床信息的結果是“你看得越多,發現得越多”,而且在病例診斷時,可信度有限[5-8]。監測人員的努力程度決定了醫院感染病例發現的數量[8-9]。不同醫院實施的監測方案差異也會影響報告的感染率,如單一信息源篩查病歷(微生物學結果、抗菌藥物處方)可能導致漏報[10-11]。因此,有必要改變傳統的醫院感染監測方式,提高監測效率和成果。本文從信息化監測方面簡述感控信息化的進展,以此推進信息化時代的感控工作。
1 信息化監測
隨著計算機、存儲設備性能的提高(同等成本下,計算能力每 2 年翻一番)[12]以及電子病歷應用的普及,臨床大規模數據采集已不是問題,感控人員必須處理和解讀大量復雜的臨床數據信息,這些數據可以幫助感控人員更好地理解 HAI 發生的危險因素,改善危險分層,明確機構內、機構間的傳播途徑,提出針對性的防控措施[1]。但海量的數據、不斷增加的變量和多維度思考判斷超出了個人信息處理能力,感控人員越來越多地希望計算機來處理這些復雜任務。
1986 年鹽湖城 Latter Days Sants 醫院建立第一個利用微生物實驗室數據識別疑似 HAI 患者的計算機系統[9]。該系統根據定義標準篩查微生物實驗室報告并發出預警,感控人員收到報警后,再綜合其他信息,如病歷信息,判斷該警報是否歸類為 HAI。30 年來,醫院感染監測信息化建設不斷發展。
1.1 半自動監測和全自動監測
計算機執行部分監測(例如使用指定的標準查找病例),再由人工進行判斷的系統,屬于半自動監測系統;計算機完全根據監測定義進行自主判斷的系統屬于全自動監測系統[10]。二者的關鍵區別在于,HAI 病例的確定是由客觀的計算機算法決定,還是由感控人員手工審查原始數據確定[1]。
目前絕大多數感染預防項目使用的程序都是半自動監測系統,包括上文的 Latter Days Sants 監測系統。半自動監測系統過濾來自實驗室、藥房、入院系統的大量數據。它們需要用戶大量輸入數據,但無需核查病歷。這類系統在減少感控人員監測的時間方面很有價值,但由于人為因素,發現病例方面仍存在差異,且半自動監測系統設置中所使用的傳統定義不適合機構間比較[11]。理想的半自動電子監測具有很高的陰性預測值(即可靠地排除沒有 HAI 的患者)和合理的特異性[13],而理想的自動化監測系統要有高特異性和陽性預測值以避免假陽性[14]。Trick 等[15]在 2004 年描述了通過內部開發的算法成功自動監測導管相關血流感染。幾年之后,該系統擴展到 4 個醫療中心使用并得到驗證[16]。
1.2 信息化監測的變量
無論半自動監測還是全自動監測系統,HAI 監測的成功往往取決于數據的準確性、一致性和及時性[17]。這要求電子病歷系統必須提供準確、可靠的臨床數據,而且這些數據的標準化程度要足夠高。這些數據可以是臨床護理數據,如人口統計信息、診斷測試結果、微生物學結果、藥房記錄和其他臨床特征,也可以是管理數據,如《國際疾病分類》第 10 版代碼[18],還可以是直接反映患者情況的數據(如手術操作)和臨床醫生記錄的數據元素(如診斷、臨床體征和癥狀)。如果數據來源適合,臨床數據的敏感性和隨時間的一致性優于管理數據[19]。因為管理數據并不是為監測目的而來,利益競爭會影響編碼評判。一項研究甚至報告根據《國際疾病分類》第 10 版發現患者導尿管相關性尿路感染的敏感性僅有 2%[20]。
提高數據采集質量的方法包括盡量減少自由文本數據輸入和將文檔簡化為高度結構化、格式化的字段等。監測人員要評價數據質量和可用性,要深度理解為什么采集這些數據以及誰采集的這些數據[21]。如血液透析中心門診患者自動化監測遺漏很多血流感染,可能很大程度上是因為血液透析電子病歷中的血培養數據不能使用[22]。
1.2.1 評價公式中分母的確定
一般用感染率評價感控效果。評價公式中的分母是準確表達感染率的一個重要組成部分,通常用有效的高危患者例數、操作例數和/或天數表示。如手術部位感染的分母是手術次數,設備相關感染的分母是“設備使用天數”。但分母的復雜性往往被低估。對于導管相關血流感染監測,目前的標準是只要患者有中心靜脈導管,不管有多少根,每天都按 1 個設備記錄。對于手工監測,通常每天固定時間進行計數。電子監控可能會產生不同的結果,尤其是按照 24 h 內存在任何管路作為“設備使用天數”。感控人員應參與到監測系統的設計,這對于確定準確、一致地采集“設備使用天數”至關重要。有了足夠詳細的記錄,程序員把電子設備計數和手工設備計數間的差異降低到最小。此外,獲取每個設備的詳細信息將有助于醫療機構為未來監測定義的變化作好準備(如未來放置 2 根導管的患者可能統計為 2 個導管日,而不是 1 個)。能夠自動接收電子設備數據的監視系統可以極大地提高分母計算的效率和準確性。在確定設備相關的使用率時,通常需要能夠按病區捕獲患者的天數[1]。
1.2.2 評價公式中分子的確定
在傳統的監測中,感控人員通常會查閱詳細的床邊記錄和/或詢問治療醫生以獲取對病情的了解。但這些數據資源可能存在問題,如機構內數據的可用性存在差異;不同感控人員對病歷的解讀存在差異,有可能為支持一個假定的結果來尋找數據;詢問臨床醫生可能也不可靠,他們傾向提出自己主觀的臨床意見,而不是評估患者是否符合監測定義標準。感控人員在考慮將哪些數據作為分子時,必須考慮到電子病歷系統中數據的可用性、可訪問性以及這些附加數據是否會影響準確性和可靠性。數據可用性涉及到不同醫療機構間的工作流程和電子文檔處理過程是否一致。例如不同機構之間血培養采集方法相對一致,因此血液培養結果是高度可用的。數據可訪問性是指數據是否以易于訪問的格式存儲。可訪問性低的數據是指不易計算的記錄以及依賴文本處理來提取的數據,如放射科的圖片資料[1]。
美國衛生保健流行病學學會對不同醫院感染類型的電子病歷監測提出了基本數據要求,如中心導管相關感染監測應包含微生物培養結果(血培養和其他培養)、出入院記錄、存在中心靜脈導管等數據元;導尿管相關尿路感染監測應包含尿微生物培養結果、尿常規、出入院記錄、生命體征(發熱)、存在導尿管等數據元;手術部位感染監測應包含淺表或深部組織微生物培養結果、手術操作編碼(《國際疾病分類第九版臨床修訂本手術與操作》)、出入院記錄、抗菌藥物使用情況等數據元;呼吸機相關事件(呼吸機相關并發癥、感染相關并發癥)應包含呼吸機設置(呼氣末正壓、吸入氧濃度)、存在氣管插管、出入院記錄、抗菌藥物使用情況、生命體征(體溫)、實驗室檢查結果(白細胞)、微生物培養結果等數據元;多重耐藥菌和艱難梭菌監測應包含微生物培養結果和出入院記錄等數據元[1]。
1.2.3 驗證
驗證的目的是檢查感染監測質量。“判斷”感染的人為因素存在固有差異,傳統的驗證側重于提高人的可靠性。無論是全自動監測系統還是半自動監測系統都需要與參考標準(通常是手工監測)進行比較,提升監測效果的準確性。驗證是一個迭代過程,在采用新數據庫或新系統時更加需要驗證[4, 8, 23]。對于已采用電子化采集此類數據的機構,美國疾病預防控制中心推薦的分母驗證方法要求醫療機構電子設備計數誤差在人工計數的 5% 以內,在電子監測開始安裝時,需要進行 3 個月的驗證,以后每年進行 1 個月的持續驗證,電子監測系統應該能夠在患者級別生成設備計數的“驗證報告”,以便感控人員審核和排除差異[1]。
2 機器學習在感控領域的應用
完成監測數據采集后,如何有效分析這些數據,也是感控人員面臨的挑戰。在數據量較少時,微軟公司的 Excel 軟件可以滿足大部分感控統計的要求,但在自動化數據采集系統中,數據量和處理維度往往超過 Excel 處理能力,需要使用計算機語言進行分析。因此,感控人員要了解常用的計算機大數據處理的基本知識,指導軟件工程師進行數據處理。
計算機科學家創造了“大數據”這個術語,指數據量大、性質復雜、傳統數據處理方法無法有效分析的數據集,通常具有高容量(數據量)、高速度(數據進出速度)、多樣性(數據類型和來源范圍)和高準確性(準確性和正確性)等特性。大數據分析是指利用非傳統的先進方法對大數據進行分析,發現有價值信息的過程、方法和技術[24-25]。Upshur[26]認為目前的循證醫學臨床推理方法常常簡化臨床推理過程,而忽略了醫學的復雜性和細微差別,計算機算法可以作為指導或輔助臨床決策的手段。
機器學習是指計算機在不直接編程的情況下“學習”,通常集中用于 TB 級別、高維的數據集,強調預測的準確性,而不是假設驅動的推理[27]。與傳統的預測模型相比,機器學習更像是一種“黑箱”方法,即機器學習算法對預測變量的選擇不透明,甚至可能違反直覺[28]。常見的機器學習算法有人工神經網絡、決策樹、支持向量機、樸素貝葉斯和 k-means 聚類[26]。
機器學習可分為監督學習和無監督學習。監督學習類似于流行病學中標準的模型擬合類型,研究人員既要觀察輸入數據,也要觀察相應的目標值(即結果)。專業人員(如醫生)為每個樣本標注“標簽”,如患病或健康。學習的目標是找到最能區分這兩類樣本的模型,正確地將患病或健康的標簽分配給新的未被標記的樣本。常見的監督學習技術包括標準的流行病學方法,如線性邏輯回歸、決策樹、支持向量機和神經網絡等算法。在無監督學習中,訓練數據由一組輸入變量組成,沒有監督學習中需要的相應目標值(結果標簽)。無監督學習的目標是完全由數據驅動,在沒有任何專家標記的情況下發現模式并從數據中提取隱藏結構。典型的例子是聚類問題,目的是將相似的數據點分組在一起[29]。構建機器學習模型的核心要求是建立一個具有代表性、多樣化的數據集。理想的做法是用最接近實際使用過程的格式精確的高質量數據訓練模型[30]。機器學習方法已經用于感染性疾病的預測和預報。有研究人員利用谷歌搜索詞預測登革熱發病率是否超過監測標準[31]。還有研究人員通過 Twitter 數據在官方報告前 1~2 周預測流感樣疾病的水平[32]。
目前,機器學習在醫院感染監測數據處理方面已經取得成就。Oh 等[33]基于電子病歷回顧性研究了密歇根大學醫院和馬薩諸塞州總醫院的數據,利用機器學習構建具體醫院模型來估計患者艱難梭菌感染風險。該機器學習模型利用 15 萬成人患者數據建立并經內部驗證,結果顯示該算法具有較好的預測性能,曲線下面積為 0.75~0.82。該模型能在診斷艱難梭菌感染 5 d 前識別至少一半的真實陽性病例[28, 33]。Colborn 等[34]利用美國外科醫師學會國家外科質量監測中心數據建立了含有 136 個預測因子的模型,通過機器學習后,對科羅拉多大學醫院的手術患者預測手術部位感染,該模型的特異性達到 90%,敏感性達到 80%。Sanger 等[35]利用華盛頓大學醫學中心導尿管相關性尿路感染監測數據建立訓練數據集進行監測系統自然語言識別的機器學習,然后利用該系統前瞻性地對導尿患者進行導尿管相關性尿路感染識別,并與查閱病史判斷導尿管相關性尿路感染的金標準進行比較,該系統識別導尿管相關性尿路感染的敏感性為 97.1%,特異性為 94.5%,陽性預測值 66.7%,陰性預測值為 99.6%。Fujikura 等[36]利用耐萬古霉素腸球菌的全基因組測序結果與暴發患者的流行病學信息整合,利用貝葉斯分析方法重建耐萬古霉素腸球菌傳播路徑,結果顯示具有后驗概率的傳輸方向,揭示了環境表面傳播過程。Liao 等[37]利用電子鼻和呼吸機使用患者相關電子病歷數據,通過反向人工神經網絡分析和支持向量機方法預測銅綠假單胞菌致呼吸機相關性肺炎,兩種機器學習模型的曲線下面積分別達到 0.98 和 0.94,具有實際應用價值。從上述成功案例可以看出,機器學習的效率和處理數據的復雜程度超越傳統監測。同時為了達到更精準的預測和決策,實現成功的機器學習還需要大量設備數據進行支撐,超出了傳統監測數據采集范圍,這對未來監測數據采集規范和標準提出更高的要求。
機器學習的優勢是模型能識別數據中人類無法發現的數據模式,同時這也是它的弱點之一[30]。機器學習需要大量、多樣的數據集來提高模型的準確性[30],但如果輸入數據集出現了偏差,就會導致預測結果大相徑庭。微軟創建的人工智能 Twitter 聊天機器人,在“學習”人類文本 24 h 內就開始發布種族主義和種族滅絕推文[38]。因此,使用機器學習系統的臨床醫生和患者需要了解它們的局限性。此外,機器學習的另一個關鍵問題是如何平衡保護隱私的監管需求。感控人員要與互聯網技術專家和數據分析師進行有效溝通和合作,這樣才能充分挖掘醫療大數據的潛力;同時醫院流行病學家也要具備一些大數據分析技術的知識,尤其是機器學習方面的知識。機器學習并不是要取代標準統計分析或隨機對照試驗,而是為流行病學家提供了新的工具來解決經典方法不太適合解決的問題,但也絕不是解決研究設計或數據質量差的萬靈藥。
3 小結
感控人員不可能親自跟蹤每一名患者,醫生也不可能與所有可能需要治療的患者單獨互動。機器學習模型的成果可以輸出應用到專業知識欠缺或欠發達地區,直接提升這些地區的感染防控能力和專業水準。機器學習可在不涉及個人能力的情況下,給予感控人員專家級水平的指導。未來,區域或國家級別的數以億級的醫療數據將通過機器學習模型分析,為患者提供更加優質、安全的醫療服務。