最新消息
首頁 最新消息
孩子心臟發育不好,我要存孩子的心電數據 | 2021-06-17 |
文章来源:由「百度新聞」平台非商業用途取用"https://new.qq.com/omn/20210527/20210527A01JHK00.html" 原創:譚婧起名字,背后往往有故事。我認識一個2020年11月出生的小朋友,名叫“建建”,取“健”字的諧音。當建建還在他媽媽肚子里的時候,就被懷疑有先天性心臟病,因為從超聲描述上看,是“二尖瓣瓣上隔膜樣狹窄,左心發育不良”。產檢的時候,建建媽媽就哭了,手里拿著報告,一路走一路哭回家。從老家,到北京。從北京安貞醫院,到北京兒童醫院。從這家,到那家。四處求告。建建媽媽說:“醫院里,我就差給醫生跪下了。”醫者仁心,在武漢協和醫院心臟大血管外科就職,擅長先心病的胡志偉主任醫師,看到北京安貞醫院的報告后,對建建媽媽說:“單純主動脈縮窄的治療效果是比較好的。但目前安貞醫院檢查報告顯示主動脈發育不良,二尖瓣發育不良,看來是左心室發育不良綜合癥,需要多次手術。三次手術,也只能是一個心室的矯治,無法成為嚴格意義上的正常心臟!所以,需要慎重考慮!”“慎重考慮”,意味著,可能要放棄孩子。北京兩家醫院都建議放棄,但是廣東省婦幼保健院心臟中心的孫善權主任醫生持不同觀點,他說:“胎兒血液循環與出生后完全不同,所以胎兒產前診斷是有巨大差異的!從描述上分析,這個孩子出生后也未必有先天性心臟病……”孫善權主任的話,給了全家希望。病情,有爭議。生下來,要賭。命運把八零后父母推搡到賭桌前,讓你全押。最后幾個月是熬著的,提前剖宮產,孩子早產了一個月,生下來,沒來得及抱一下,就進了兒童重癥監護室,保溫箱一住就是十五天,膠布貼滿了腦袋。出院后,奇跡發生了。建建的小心臟健康了。真的,沒開玩笑,醫生說這種情況只有5%。困難面前,建建媽媽沒有“顧影自憐”,而是“自學成才”。新聞上報道人工智能在醫學領域有很多成功的應用,建建媽媽就向醫生咨詢——智能心電設備。“如果我給孩子準備一個智能心電設備(類似手、環手表的可穿戴設備)您看能行不?因為孩子出生的時候,是確診的主動脈弓偏細的問題,這種設備我想著也是現在的發展趨勢,需不需要準備上這類醫療器械專業級產品,給孩子日常備份一下心電數據,您說這樣有用不?”對此,北京兒童醫院的朱耀斌醫生的回復是:“其實吧,你就量個心率就行,量個(血氧)飽和度就行了,我覺得足夠了。”醫生沒有直接推薦智能心電設備。但是,建建媽媽告訴我:“這些數據,(對我的孩子)有用。”現實很殘酷,市場上并沒有兒童專用,且能在日常環境中提供醫療級精度的智能心電設備。建建媽媽說,她對這類產品的希望是,戴在身上,(孩子)看上去和正常的孩子一樣。平時孩子身上戴了個笨重的醫療儀器,會讓別人覺得他不健康。要是手表、手環什麼的,綁個手機APP,隨時能看到孩子的變化,多好。建建媽媽懷孕的時候,也使用過醫院提供的“胎兒監護儀”。“孩子一翻身,心跳就會加速,儀器都能監測到。”因為是借用,后來儀器還給了醫院。既然測量過,便萌生了存下這些數據的想法,雖然不知道這些數據具體是啥,但是她想存下來。這些數據中。有一種就是心電數據。(心電信號數據,心電圖數據,往大里說,都是心電數據。)養兒一百歲,長憂九十九。建建媽媽覺得,哪怕未來只有1%的可能會用到,現在也想做100%的準備。心電信號的特征是,隨機性強、信號微弱、抗干擾性差。所以,捕捉這種信號需要耐心。抓住心臟病這個“犯罪分子”,要心電監測時間夠長,采集到全部吃喝拉撒、喜怒哀樂、跑跳玩鬧的心電信號。所以,心電有一個流派是可穿戴設備,玩的是動態心電圖。無獨有偶,京東大數據研究院在2021年4月發布了《2021健康減脂消費趨勢報告》,其中“智能穿戴設備具有心率檢測,血氧檢測的,銷量同比增長170%,具有心電圖檢測的,關注度同比提升超10倍。”可真是要謝謝這幾年可穿戴設備的瘋狂生長。這樣心電數據的來源就可以非常廣泛,比如,從第4代開始的蘋果手表AppleWatch就有心電圖功能,是單導聯心電。而多導聯心電,這個流派,玩的是靜態心電圖,用于復雜診斷,一般指常見的靜態12導聯心電圖。腦補一下貼很多電線在身上,平躺在醫院檢查的白色窄床上,休息一陣再檢查。拿修鋼琴的師傅打個比方,單導聯心電就是師傅檢查節拍,看拍子準不準。多導聯心電就是師傅對著鋼琴說,抱歉了您嘞,全面專業檢修。好消息是,在心血管領域,中國有最龐大的患者群體和最豐富的臨床病例,與最新信息技術的結合,發展空間巨大。與此同時,人工智能科學家也在想辦法,挖掘數據對病人的價值。人工智能對數據的要求很高,心電圖在中國醫院就有不短的歷史,可以追溯到九十多年前。1928年,北京協和醫院從英國Cambriger公司購買了兩臺標準雙極導聯心電圖機。僅在1928年到1949年期間,北京協和醫院中心就積累了3萬多份雙極導聯心電圖的資料。這只是萬里長征第一步,“中國正常成人心電數據庫項目”2011年啟動,中國心血管健康聯盟的數據中心建在蘇州,《中國正常成人心電數據庫》2018年發布。人工智能“看懂”心電圖是一個有趣、有意義的研究方向。2017年,知名華裔美國科學家吳恩達團隊出過一篇論文,當時的數據集是3萬多份30秒時長的心電圖片段。論文中,人工智能技術從心電圖中識別14類心律不齊。論文作者也強調:“心律信號之間的差異可能非常細微,比如說,有兩種心律不齊都叫做二度房室傳導阻滯,它們在心電圖上的表現也非常相似,但一種需要立刻治療,一種不需要。”2019年,吳恩達團隊保持好奇心,繼續跟進這一研究方向,他們使用人工智能遷移學習分析心電圖的論文,登上了《自然》旗下頂級醫學期刊NatureMedicine雜志。在國內,也有廠商關注這個領域,醫療器械廠商樂普醫療就較早進入。2018年11月,樂普醫療的心電圖人工智能自動分析診斷系統(AI-ECGPlatform)通過了美國FDA。在2020年第三季度,研發了首款使用人工智能深度學習分析算法的心電圖設備“心電圖機”(OmniECGB120AI),獲NMPA注冊批準。2021年4月,“樂普系”頻頻與資本握手,進入上市階段。現在并不清楚樂普醫療未來會給智能心電多少投入資金,但這是一個良好的開始。在這些背景下,中科院自動化所助理研究員牛景昊博士和“親愛的數據”主編譚婧討論了:在人工智能自動“看懂”心電圖這條路上,有何進展?#1AI準備好了嗎?醫療數據是不撒謊的日記,人們平時就醫會被醫生詢問過敏史、重大病史等,這些就是在回顧歷史數據。醫療數據敏感,且稀缺。誰有病也不想讓不相關的人知道,所以,誰有資格被授權接觸和利用這些數據,可能需要長期的討論才能有答案。所以,醫療平臺之間的數據互通困難,不僅僅是技術和金錢的問題。個人醫療數據只用于一次性診斷有些浪費,但是很難建立醫院中臺統一處理各方面的數據。比如,家中監測的智能手環數據,難以與住院期間的生理指標合并分析。有數據,來標注,人工智能這個時候出場才有戲。醫療數據對每個人重要,對人工智能技術也很重要。如今,一定數量的高質量的標記數據,成為人工智能能夠成功的重要因素。標注,就是醫生親自“劃重點”。數據需要讓醫生來標注,標注者的門檻高,成本昂貴,所以,醫療數據金貴。而且,難以大規模批量化生產。這也可以解釋為什麼現在醫療數據比其他類別的數據集規模要小。高質量的標注數據是人工智能技術的彈藥,將通用診斷模型優化為個性化的、更高精度的算法模型。比如,國際知名的心電領域2020年心電數據分析挑戰賽,由PhysioNet組織。這幾乎可以算是目前最大的公開數據集。賽方通過對現有12導聯心電圖公開數據庫進行組織和整理,提供了一個含有來自4個國家的66361份心電圖記錄的大型數據集,用于人工智能算法的模型訓練和性能評估。從數據集的規模這一點上看,心電圖和計算機視覺比起來,還是弟弟。計算機視覺大規模數據集ImageNet,有14197122張圖像(截止到2021年3月11日)。(注:PhysioNet英文全稱為ResearchResourceforComplexPhysiologicSignals,直譯為“復雜生理信號研究資源”,有網站,有美國國立衛生研究院的資助,現在由美國麻省理工學院的計算生理學實驗室管理。從這個數據集的管理也可以看出來,醫療數據涉及學科交叉,需要信息技術和醫療部門都貢獻力量。)當前,有一些心電圖智能設備廠商或者研究團隊,公開報道稱其自研的模型訓練使用了比現有公開數據大百倍到千倍的私有數據。雖然這些心電數據規模十分龐大,但是,賦能智能算法可能的局限在于:第一,大部分是健康患者數據,對異常的判別貢獻低。第二,疑難雜癥的精細標注有限,缺少頂級醫療機構的高年資醫生背書。雖然心電數據是吞金獸,花錢如流水,像富二代,但它是很有個性的,能以小見大。為什麼這么說?因為心電數據的每個測量值都是有實際意義的數據,即使最小信息尺度的數據,也可以釋放出很強的信號,包涵很多有意義的內容。將心電信號數據和圖像數據比較,圖像數據的最小信息尺度的數據是像素點,需要多個像素點組合才能傳遞信息。打個比方,APPLE,是蘋果,這個單詞里的每個字母,都不能單獨表達意思,但是有的中文詞匯可以。心電信號數據像中文,單個字符都能表達一些具體的意思,“高矮胖瘦”里的每一個字都能表達具體的信息。圖像數據像英文,比如最小組成字符是字母(像素點),單個字母單獨拿出來分析,沒啥用,是缺少信息量的,需要字母組合到一起,才能表達出一個完整的意思。心電圖數據有可能僅基于一個數據點就可以醫學判定為不正常,但是這在圖像領域是不可能的。雖然圖像像素點也有信息量,但是不容易直接對應規則。但是,完全不可能單憑一個像素值,區分是狗還是貓。可是,心電數據能夠基于一個“點”來設定專家判斷規則。近些年,在人工智能領域大放異彩的深度學習模型可以自動學習特征,所以,在圖像這種難以直接設定規則的領域很早顯示出統治力,基本不需要額外的手工特征。而在醫學生理信號應用中,專家設計的規則特征依舊有很大價值,研究方向有很多,比如使用深度學習算法分析人體的心電信號,可以將深度模型和醫學專家知識有機結合。比較而言,心電數據更依賴專家設計的規則特征。#2AI和醫生怎么相處?智能醫療產品有不同程度的診斷能力,對應的情況也大不相同。雖然建建的媽媽對兒童專業級智能心電產品滿眼小星星,但是,醫生的態度很關鍵。先來幾個靈魂拷問,第一、醫生能不能100%相信人工智能?第二、醫生會愿意使用一個替代自己診斷的東西嗎?第三、人工智能給出一個方案,醫生還要重新再整一遍,那問題來了,醫生的反問是:“我為什麼要用這個雞肋一樣的智能設備?”人工智能給一個結論,然后不解釋,掉頭就走,那誰也不敢信它的結論。再牛的技術也不能傲嬌。人工智能說:“不在,別找,找也不回,煩得很。”人工智能科學家說:“想動手,怕你不抗揍。”人工智能心電醫療的產品線很長,就診周期三階段都有涉及,包括診前分診(常規檢查)、診中(輔助治療)、診后(慢病管理)。簡單理解就是,從入院,到出院。如果不解釋,分診的醫生、治療的醫生、護理人員都會一臉嫌棄。在診斷醫生看來,雖然人工智能模型在實驗室數據(測試數據)上分類的平均準確率很高,但是,有沒有可能是患者個體特殊,人工智能的這個判斷對這個患者不合適。這種情況下直接使用人工智能的診斷會給患者帶來很大的風險。所以,未來,人工智能拿出的解釋,應該充分接入醫生的問診流程,根據循證醫學的框架,從支撐診斷結果的醫學證據角度,來提供可解釋性信息。比如,若干人工智能模型對患者信息的分析,可以對應某一條醫生可以理解的診斷。提升人工智能醫療應用的可解釋能力,就是要結合醫生在真實看病過程中的思維模式,給出特定診斷所必需的醫學依據,從而讓人工智能結論能夠被醫生認可理解和采納參考。某類疾病,不能只有心內科的人可以看,也可讓多科室的醫生同步了解,這樣既給會診帶來便利,也提升了寶貴醫療數據的可復用性,減少漏診和誤診的發生。再舉一個專業性更強的例子,心電圖中的ST段(簡單理解是心電圖里的一個波段)。ST段幅值高于標準值,就可以給出很強的心電異常診斷信息,如果模型既能給出正確的異常分類,又能給出解釋:主要由于ST段的異常導致了這種診斷結論。這樣的話,就有理有據。第二步,人工智能心電醫療,可以參與輔助決策。比如心臟電介入手術這個場景,現在一些比較精密的心電檢測設備的測量值,可以為輔助診療提供很大的參考,甚至可以對手術的方案給出具有一定指導性的建議。人工智能產品直接給了診斷結果,醫生第一反應是:“我能不能簽字。”這背后的問題就是,如何讓醫生去相信人工智能產品的結論?牛景昊博士在采訪中表示,當前用于智能心電算法評估的公開數據集由于病種不同,彼此比較孤立,單純在某幾個數據集拼算法精確率指標,意義不大。此外,在臨床醫學中,患者的病情往往是變化的。比如,心電數據和多種類型的疾病有關,人工智能可能對于某幾種訓練數據充足的疾病類型精確率高。但是,有些病就是疑難雜癥,醫院專家的會診結論都難達成一致,這些人工智能軟件就更難處理。所以,最近,牛景昊博士團隊在做這樣一件事情,讓人工智能產品的結論給醫生看了后,就像是一個年資深的醫生給出的參考意見。于是,人工智能產品在幫助醫生這個事情上,就往前推進了一小步。遺憾的是,當下,很多公開的數據庫涵蓋的異常類別相對少,現有研究切入點也是找一些爭議小的地方。當遇到爭議很大的疾病,醫生也有對心電數據拿不準的時候,醫工交叉的合作會回到實驗室。#3性感的技術趨勢2021年,人工智能技術的大熱點就是大規模預訓練。業界共識:這是一個能做出成果的方向。從谷歌到BAT,很多人工智能科學家認為,這是很有想象力的方向。醫療人工智能也在往訓練超大模型這個方向發展,大規模預訓練和自監督學習的技術使得模型對數據標注的要求變低。比如說,一家三甲醫院可能已經有上萬例的心電數據,但實際上數據缺少非常精細的標注,可能用不了。以前,經典的深度學習方法需要大量的數據才能達到有效的結果。但是,現在有了人工智能自學習的方法,創造了更多可能。這種預訓練算法需要結合數據的特性去專門設計。預訓練的方法可以適配于心電數據,把模型遷移過來用。因此,用一些通用的預訓練技術,充分利用超大規模的、標注質量可能有限的心電數據,獲得類似于NLP(自然語言理解)領域的超大預訓練模型,將惠及更多下游子任務。用金庸的話說,就是,張無忌起初修習九陽神功五年,內力精進之后其他各類武功學習都是手到擒來,基本一學就會。這個可能取決于兩點:第一點,把用于NLP或者是用于CV(計算機視覺)的成熟方法,很好地遷移到醫療這個垂直領域的任務上。第二點,人工智能有生成圖片的能力。人工智能模型(GAN)可以生成一些訓練樣本來提升模型精度指標。簡單理解,自己動手豐衣足食。也就是,人工智能生成“自己需要的醫療數據”。醫療生成數據主要為了提前產生訓練數據中,沒有收集到的患者模式(癥狀、局部影像異常、指標等),后面,用于提升模型的訓練后精確度和穩定性。然鵝,“第二點談到的”,利用“人工智能造的數據”提升的模型性能是不是可靠,這里有一個大問號。人工智能生成的數據樣本使數據測試集的指標提升,但無法保證這些生成的樣本是真的能夠符合患者天然的病情表現。如果說“人工智能造的數據”是跟患者天然病情表現有差異,那么這些樣本的可靠性就存疑。醫療人工智能也在往訓練超大模型這個方向發展,十分期待跨時代的標志性成果出現。醫療人工智能領域的科學家關注類似這樣的問題:如何最好地利用預訓練模型獲得更好的效果?如何使用預訓練模型最佳地適應目標任務?用大規模的預訓練模型去提升小樣本分類任務的性能的原理是,預訓練模型是找到了一個共性(有點像commonsense,或者叫做常識)。比如說人工智能模型能分辨橘貓的時候,是對貓的分類這個任務有點“理解”,不同的貓,大概也能分類,但是準確率低。放在NLP場景里,這個詞就像“語感”。比如初中英語完形填空題目,給你一段話,中間挖掉幾個詞,讓人工智能去預測(predict)填哪個詞好。母語英語的人,順嘴就出來,這種情況就是“語感”。大模型的能力也是類似,知道下一個字或者下一個詞應該是什麼。也可以理解為,預訓練模型把人類的語言知識,先學了一些。然后,再代入到某個具體任務,就順手了。學術論文里寫的就叫context,直譯就叫“上下文”。學術上講,是預訓練通過自監督學習從大規模數據中獲得與具體任務(下游任務)不直接相關的預訓練模型,預訓練模型優化相關參數,模型再跑到小樣本上訓練(在學術界就叫做下游任務),小樣本模型效果相比于只依靠下游任務的訓練數據有較大提升。正常情況下,疑難雜癥比較少見,相對的,疑難雜癥的數據集一般也會規模較小。比如在處理疑難雜癥這種小規模樣本數據的時候,先在大數據集上預訓練,再對模型進行微調(fineturn),微調就是針對疑難雜癥修正模型。大模型預訓練,專治疑難雜癥和各種水土不服。如果沒有預訓練大模型,僅能用小規模數據,也就是那種疑難雜癥的數據去訓練和測試,小樣本的標注量比較少,就局限很大,效果很差。遷移學習(TransferLearning)是人工智能技術中的一種,預訓練模型把遷移學習很好地用起來了。它所關心的問題是:什麼是“知識”,以及如何更好地運用之前得到的“知識”。遷移學習技術的應用有兩點:1病種之間的遷移比如說房顫分類,它是一個患者數量特別大的心電圖異常(預訓練模型),把這類數據中學到的經驗(姑且稱為“先進經驗”)遷移到一些提升疑難雜癥的心電疾病數據庫里(又稱小樣本),用“先進經驗”把小樣本數據庫上訓練的模型的精度提升上去(下游任務),進而提高了疑難雜癥心電疾病數據庫里訓練模型的精度,這也可以稱為跨病種的遷移。2醫療機構之間的遷移比如拿一個美國人的數據庫,去中國人的、私有的、小規模的心電數據基礎上做遷移。用美國人的心電數據大樣本中找到的“經驗”,來提升中國人的心電數據訓練模型的精度,這就是中美醫療機構之間的遷移的例子。舉一個例子,心電做惡性心率失常預警。因為單導聯的心電數據房顫篩查的數據采集普遍(蘋果、華為手環,謝謝了),房顫篩查這類疾病就能收集到大量數據,進而用這些數據預訓練模型得到經驗,再給比如惡性心率失常(患者樣本較少)這一病種做加速,縮減訓練周期,同時提高惡性心率失常模型的預測精度。換句話說,借助一系列自然語言理解領域大獲成功的預訓練模型(ELMo、GPT、BERT等),通過學習標注條件比較一般的、與特定疾病診斷無關的大量心電圖數據,使得模型獲得對于心電信號處理心電數據的一種“語感”,然后在特性任務的小數據上微調。遷移學習可以有很多方法,微調是其中的一種手段。牛景昊博士觀點:盡管用智能算法去處理多模態數據這一方法,推動了特定領域的進展,但不能為了多模態,而多模態。他的理念是:不要為了追求更好的結果,特意收集全面的數據,更好的是,在一個場景里,恰好有多種模態的數據,把它用好。好比醫院里的過度檢查,信息量多了,對判斷會有一點幫助,但是不是最合適的,需要具體情況具體分析。可獲得的醫療數據不全面,在實際業務中很可能是常態,學術界在醫療數據維度缺失的處理方面有持續的關注。建建媽媽說:“孩子第一聲哭和貓叫一樣,現在嗓門很大了,能吃能喝能睡能喊。”說的時候,她聲音里都是高興。我問建建媽媽:“你有什麼想對人工智能科學家說的話嗎?”她說:“希望提醒心臟可能出現的問題,為孩子爭取最佳的治療時機。”你有什麼想對人工智能科學家說的話嗎?希望提醒心臟可能出現的問題,為孩子爭取最佳的治療時機。全文結束更多閱讀:科技大廠 關鍵字標籤:www.qtmedical.com |
|