大數據背景下的數字醫療與生物信息

文│張曉華、金俞
翻譯王丹丹、李軍焯
圖│何杰平(部分圖片由作者提供)

你是否曾關注 Google AlphaGo 與圍棋世界冠軍柯潔的對戰?你是否聽說機器人醫生沃森赴華「出診」,10秒為癌症患者提供診療方案的新聞?你是否看到過人工智慧診斷乳腺癌的表現甚至超過了專業的病理學家的報道?近年來,隨著大數據與人工智慧的快速發展,以及我國大力推進健康醫療行業及醫療人工智慧的變革,數字醫療將成為一個不可避免的趨勢。利用人工智慧等技術,政府將可以節省的費用更加有效地用於醫療供應,提供疾病和護理管理。

兩大研究方向

除了數字醫療方面,隨著先進的生物分析技術的不斷推出和更新,生物醫學數據迅速積累,基於此類大數據一些以往不能解決的問題將有望解決。生物信息學相關的大數據技術和相關應用主要包括:基於高通量測序的個性化基因組、轉錄組和蛋白組研究,單細胞水平基因型和表型研究,人類健康相關微生物群落研究,生物醫學圖像研究等。利用生命系統本身的規律和知識,建立合理的假設和數學模型,對數據進行分析和解釋,是利用生物信息學大數據的根本目標與追求。

張曉華教授實驗室自2016年創建以來,一直專注於研究這兩方面的內容:一、利用可穿戴設備對人體生理動態參數進行連續監測,進而探討相關疾病與生理動態系統的關係,例如糖尿病、呼吸病和心臟病;二、通過高通量測序的個性化基因組、轉錄組和蛋白組研究,探究精準醫療與相關疾病的相關性。目前這些研究都得到了澳門政府、澳門科技基金會、澳門大學和健康科學學院的大力支持,各項目也在持續進行中。

張曉華教授帶領的研究團隊

數字醫療

糖尿病是一種慢性代謝異常疾病,主要是由於體內胰腺不能分泌足夠的胰島素或體內細胞不能正常利用分泌的胰島素。最終導致血糖上升並長時間維持在高血糖狀態。中國是全球糖尿病患者人數最多的國家,根據已發表的全國性調查,過去30年來,中國糖尿病患病率急劇增加。老年人、男性、城市居民、經濟發達地區居民、超重和肥胖者的糖尿病患病率更高。如何對血糖數據進行方便快捷的監測?如何預防糖尿病的發生,在患者確診為糖尿病之前,提前進行干預治療,恢復健康狀態?如何從連續監測的海量血糖數據中,分析處理這些數據並挖掘出有用資訊?這些問題正是張曉華教授實驗室在進行的研究。

目前,在醫院與家庭中,患者是通過札手指方式進行日常水準監測。通常糖尿病患者每天都要測試四次或以上血糖,使用一根細針刺破他們的手指。這對許多人來說是痛苦且不方便的,這可能導致檢測頻率降低,從而影響血糖水準的控制。對於糖尿病前期患者,如果通過連續監測血糖,就可以在確診為糖尿病之前提前干預治療,恢復到健康狀態。在與廣州醫科大學第一附屬醫院內分泌科合作專案中,被試者使用微創連續監測血糖設備(圖一),研究團隊以此探究1型糖尿病、2型糖尿病、糖尿病前期和健康人的血糖動態複雜度和分形性的特點,並開發了R套裝軟體和相關函數,比較各種類型糖尿病患者血糖動態複雜度和分形性的不同。

Dexcom G4 PLATINUM 連續血糖檢測儀,已被美國FDA批准,可以連續監測血糖7天。

在該實驗專案中,我們研發的R套裝軟體名為CGManalyzer,並發現糖尿病一型、二型患者,糖尿病前期和健康人之間,血糖數值的複雜度參數有顯著差異(圖二),進而考慮可以通過複雜度參數的變異性,來評估糖尿病前期患者的身體狀況,從而對糖尿病前期患者進行干預治療、生活方式、飲食結構和運動情況的調節,將血糖調整到健康人的狀態。開發的R套裝軟體包含了多種用於分析連續監測血糖數據的函數,提供了廣泛而全面的數據分析方法,包括如何讀取一系列數據集,如何得到血糖的匯總統計數據,如何畫圖、轉換時間戳記格式、修正缺失值,如何評估每日差異的平均值以及連續重疊的淨血糖作用,如何計算多尺度樣本熵,進行成對比較,如何繪製各種反映血糖參數資訊的圖表。該套裝軟體發表在Bioinformatics 34: 1609-1611, 2018。該套裝軟體極大地促進了各種連續監測血糖數據的分析,並説明相關研究者對糖尿病的進一步探究。

除了與醫院合作,實驗室還曾在澳門範圍內開展過一項實驗,探究運動、心率、睡眠和飲食結構,對健康人與糖尿病患者的影響。本次實驗利用Fitbit charge 2 設備連續監測被試者的心率、睡眠品質與運動情況,使用Freestyle血糖檢測儀連續監測被試血糖波動情況,通過被試者每天拍照和文字記錄飲食情況。該研究項目吸引了眾多參與者進行實驗,該專案在數據分析處理中。

除糖尿病之外,實驗室還利用可穿戴設備對慢性阻塞性肺病、哮喘、過敏性鼻炎等呼吸病,心臟病進行研究,各項實驗都在進行中。

張曉華教授,健康科學學院教授、博士生導師,美國統計協會會士和國際統計學會成員,研究領域涵蓋醫療人工智慧、高通量篩選、基因表型、精準醫療、數字醫療、高通量基因測序、臨床生物大數據醫用人工智慧開發等多個領域。

生物信息學

在生物信息學方面,實驗室也開展了許多研究項目。在基於第二代測序技術對變應性支氣管肺麯黴病(ABPA)病人轉錄組的綜合性研究挖掘其深層機制專案中,運用第二代測序研究與呼吸道疾病相關的非編碼RNA,如長鏈非編碼RNA(lncRNA)、環RNA(circRNA)。與廣州醫科大學附屬醫院及呼吸道疾病研究所合作,通過對正常人和病人的轉錄組比較研究,挖掘與該疾病發病相關的非編碼RNA,從而為該疾病的分子診斷及治療靶點的設計提供新的線索和思路。

此外,與副校長(研究)、健康科學學院葛偉教授的實驗室合作,通過對不同處理的(如:利用Crispr技術對YX-1基因進行敲除)斑馬魚轉錄組研究來挖掘與該基因相關的長鏈非編碼RNA,為斑馬魚的生長發育研究提供新的分子理論基礎。通過與健康科學學院院長鄧初夏教授的實驗室合作,我們在新的高通量RNA測序技術Drop-seq的基礎上,使用大鼠模型研究乳腺腫瘤細胞的分類和分化。鄧教授的實驗室負責生物測定和RNA測序以提供Drop-seq數據,我們的實驗室主要側重於數據分析,以探索大鼠乳腺腫瘤細胞分類和分化潛在的分子機制,包括表達量化、聚類分析,標記基因鑒定等。

金俞,張曉華教授的博士生,現主要負責臨床醫學大數據分析處理,專攻方向為連續監測生理數據在呼吸病中的應用與研究,探究機器學習與非線性方法對疾病的預測與診斷。

在基於CRISPR/Cas9技術全基因文庫的建立及大規模篩選分析技術開發專案中,實驗室與廣州銳博生物有限公司進行合作,得到了廣州市科技創新發展專項資金支持。專案聚焦CRISPR/Cas9技術基因編輯應用開發,開發便捷化學合成RNA用於CRISPR/Cas9的創新方法,逐步建立世界首個化學合成CRISPR/Cas9人類全基因組文庫,形成科學、可靠的CRISPR/Cas9技術大規模篩選數據分析系統。實驗室負責建立適應CRISPR/cas9高通量篩選的數據分析系統。課題組應用和改進前期建立的siRNA文庫高通量篩選體系,建立CRISPR/Cas9體系目標物庫設計、對照組設定、多孔板選擇、樣本量確定分析數理模型;同時,將數據質控的思想引入實驗設計源頭,解決和校正系統實驗偏差。

第20期 | 2019年

同期更多故事

2019-11-22T13:17:01+08:00