鐘南山院士團(tuán)隊(duì)與騰訊AI Lab日前披露了利用AI預(yù)測(cè)COVID-19患者病情發(fā)展至危重概率的研究成果,可分別預(yù)測(cè)5天、10天和30天內(nèi)病情危重的概率,有助合理地為病人進(jìn)行早期分診。這項(xiàng)研究已在2020年7月15日發(fā)布于國(guó)際頂級(jí)期刊《Nature》子刊《Nature Communications》。

  這項(xiàng)名為《深度學(xué)習(xí)在新冠肺炎危重患者早期分診中的應(yīng)用》的研究,是鐘南山院士團(tuán)隊(duì)與騰訊公司共同成立的大數(shù)據(jù)及人工智能聯(lián)合實(shí)驗(yàn)室的成果之一,第一作者分別是廣州呼吸健康研究院院長(zhǎng)助理梁文華博士,以及騰訊AI Lab醫(yī)療中心首席科學(xué)家姚建華博士,鐘南山院士、廣州呼吸健康研究院院長(zhǎng)何建行、騰訊AI Lab醫(yī)療中心負(fù)責(zé)人黃俊洲均為共同作者。

  大數(shù)據(jù)及人工智能聯(lián)合實(shí)驗(yàn)室副主任、騰訊醫(yī)療副總裁吳文達(dá)醫(yī)生指出,當(dāng)前新冠肺炎疫情在全球持續(xù)蔓延,高效抗疫、降低患者死亡風(fēng)險(xiǎn),仍是取得抗疫勝利的關(guān)鍵,希望大數(shù)據(jù)、人工智能等新技術(shù),以及騰訊海量的用戶觸達(dá)能力,騰訊云安全、快速部署的能力,能夠在抗疫常態(tài)化中發(fā)揮作用,更有效地防控流行病疫情。

  此項(xiàng)研究基于人工智能深度學(xué)習(xí)所建立的生存模型,對(duì)COVID-19患者入院時(shí)的10項(xiàng)臨床特征進(jìn)行分析,可以幫助預(yù)測(cè)患者發(fā)展至危重病情的風(fēng)險(xiǎn),如在患者住院期間持續(xù)采用此模型進(jìn)行分析,預(yù)測(cè)結(jié)果會(huì)更加準(zhǔn)確,有助于監(jiān)測(cè)患者住院期間的風(fēng)險(xiǎn)趨勢(shì)。依據(jù)此模型開(kāi)發(fā)出的預(yù)測(cè)工具“COVID-19患者重癥早期分診系統(tǒng)”已經(jīng)在線公開(kāi),臨床醫(yī)護(hù)工作人員也可以訪問(wèn)微信小程序獲得這一工具。

  醫(yī)護(hù)人員只需輸入患者的臨床特征,重癥早期分診系統(tǒng)就可以返回患者在5、10和30天內(nèi)病情發(fā)展至危重的概率,進(jìn)而對(duì)患者進(jìn)行早期分診,對(duì)于COVID-19疾病的管理具有極高的臨床和經(jīng)濟(jì)價(jià)值。

  同時(shí),這項(xiàng)研究成果也通過(guò)Github向全球開(kāi)源,以支持全球抗擊新冠疫情。

  臨床研究顯示,輕度的COVID-19患者通常是自限性的,即疾病在發(fā)生發(fā)展到一定程度后,靠機(jī)體調(diào)節(jié)能夠控制病情發(fā)展并逐漸恢復(fù)痊愈。但6.5%的患者有突然進(jìn)展為嚴(yán)重疾病的趨勢(shì),這些重癥病例不但需要大量的醫(yī)療護(hù)理資源,其死亡率也高達(dá)49%。因此患者突然惡化為重癥是抗疫工作中主要關(guān)注的問(wèn)題,盡早識(shí)別有重病風(fēng)險(xiǎn)的患者并早期進(jìn)行干預(yù),對(duì)于患者預(yù)后的改善至關(guān)重要。同時(shí)早期識(shí)別不同風(fēng)險(xiǎn)的患者進(jìn)行有效分類,也有利于醫(yī)療資源的高效合理分配,確保最有重癥風(fēng)險(xiǎn)的患者盡快得到最合適的醫(yī)療及護(hù)理,這種能力在疫情大規(guī)模爆發(fā)時(shí)更是至關(guān)重要。

  然而,準(zhǔn)確預(yù)測(cè)患者進(jìn)展至重癥的風(fēng)險(xiǎn)并非易事。研究團(tuán)隊(duì)發(fā)現(xiàn),臨床中與此相關(guān)的患者特征多達(dá)74個(gè),這使采用傳統(tǒng)方法建立準(zhǔn)確的預(yù)測(cè)模型難以實(shí)現(xiàn)。但大數(shù)據(jù)與人工智能的發(fā)展將不可能變?yōu)榭赡,大?shù)據(jù)及人工智能聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)以騰訊AI Lab技術(shù)為核心,通過(guò)機(jī)器學(xué)習(xí)選擇變量算法,確定了十個(gè)患者特征指標(biāo),包括X線影像異常、年齡、呼吸困難、慢性阻塞性肺病、合并癥數(shù)量、癌癥病史、中性粒細(xì)胞/淋巴細(xì)胞比、乳酸脫氫酶、直接膽紅素和肌酸激酶,以來(lái)自575個(gè)醫(yī)療中心的1590名COVID-19患者病例進(jìn)行模型訓(xùn)練,進(jìn)而開(kāi)發(fā)出深度學(xué)習(xí)生存Cox模型。這個(gè)模型可以根據(jù)COVID-19患者入院時(shí)的臨床特征,預(yù)測(cè)病情發(fā)展至危重病的風(fēng)險(xiǎn)。

  研究團(tuán)隊(duì)還對(duì)深度學(xué)習(xí)生存Cox模型的一致性進(jìn)行了驗(yàn)證,評(píng)估模型預(yù)測(cè)結(jié)果精準(zhǔn)度的一致性指數(shù)(C指數(shù))為0.894,較未進(jìn)行深度學(xué)習(xí)的經(jīng)典Cox模型的0.876有所提升,更顯著高于CURB-6模型的0.75。

  為測(cè)試模型的普適性,研究團(tuán)隊(duì)還對(duì)不同地理區(qū)域和不同衛(wèi)生資源水平的三個(gè)獨(dú)立隊(duì)列進(jìn)行了模型測(cè)試,三個(gè)患者隊(duì)列涵蓋武漢940例、湖北省武漢市以外地區(qū)380例,以及疫情期間未出現(xiàn)健康資源枯竭的廣東73例,外部測(cè)試病例均與模型訓(xùn)練病例范圍不重疊。三個(gè)獨(dú)立隊(duì)列測(cè)試中,C指數(shù)展現(xiàn)的重癥模型預(yù)測(cè)與實(shí)際發(fā)生一致性分別為0.878、0.769和0.967,排除10個(gè)臨床特征參數(shù)缺失超過(guò)3個(gè)以上患者后的隊(duì)列測(cè)試模型預(yù)測(cè)與實(shí)際發(fā)生一致性分別為0.890、0.852和0.967,顯示深度學(xué)習(xí)生存Cox模型的準(zhǔn)確預(yù)測(cè)具有普適性。

  這個(gè)AI預(yù)測(cè)系統(tǒng)較傳統(tǒng)預(yù)測(cè)模型還有其他的優(yōu)勢(shì),包括應(yīng)用當(dāng)中自動(dòng)填補(bǔ)缺失數(shù)據(jù)而進(jìn)行預(yù)測(cè),以應(yīng)對(duì)不同地區(qū)和醫(yī)院的實(shí)際情況,以及可以隨著應(yīng)用數(shù)據(jù)的增加而不斷進(jìn)化,準(zhǔn)確性可以進(jìn)一步提高。

  今年2月27日,鐘南山院士團(tuán)隊(duì)與騰訊公司宣布達(dá)成合作,共同成立大數(shù)據(jù)及人工智能聯(lián)合實(shí)驗(yàn)室,攜手持續(xù)抗擊新冠肺炎疫情,將以大數(shù)據(jù)及人工智能攻堅(jiān)流行病、呼吸疾病和胸部疾病的篩查和防控預(yù)警。