售前電話
135-3656-7657
售前電話 : 135-3656-7657
本文將會討論三個(gè)部分的內(nèi)容
1.醫(yī)療知識圖譜和通用知識圖譜的差別
2.醫(yī)療知識圖譜的兩個(gè)特征
3.醫(yī)療知識圖譜的幾個(gè)具體的應(yīng)用場景
對知識圖譜的預(yù)測
hype cycle 2018預(yù)言了知識圖譜的上升。與此同時(shí),許多企業(yè)也開始推出自己的知識圖譜服務(wù)。從通用的圖譜到金融領(lǐng)域反欺詐,各類的圖譜如同雨后春筍般地推出。
(2018 關(guān)注知識圖譜的上升)
但是,的預(yù)測,主要面向的是通用知識圖譜,而并非是某個(gè)領(lǐng)域知識圖譜的發(fā)展。尤其并不適用于醫(yī)療領(lǐng)域知識圖譜。
通用知識圖譜 vs醫(yī)療領(lǐng)域知識圖譜
醫(yī)療領(lǐng)域的知識圖譜( Graph, 下稱BMKG)和通用領(lǐng)域知識圖譜( Graph,GKB)之間的區(qū)別是非常大的。
通用領(lǐng)域知識圖譜的主要任務(wù)是發(fā)現(xiàn)大量不同類型的實(shí)體和關(guān)系,為各類通用服務(wù)提供知識的支持。因?yàn)榭色@取的數(shù)據(jù)量大,因此各類深度學(xué)習(xí)方法,可以得以廣泛應(yīng)用。因此可以認(rèn)為是一類率先成熟的知識圖譜。
而生物醫(yī)療領(lǐng)域的知識圖譜,則是生命領(lǐng)域中,探索相對有限的類型的實(shí)體,及其之間的超級復(fù)雜的多樣化關(guān)系。BMKG的每個(gè)實(shí)體和關(guān)系,都是由實(shí)驗(yàn)室實(shí)驗(yàn)和臨床試驗(yàn)的結(jié)果中抽取提煉而來。
(基于循證的知識圖譜)
相比起通用知識圖譜,醫(yī)療領(lǐng)域知識圖譜更加關(guān)注精確率。而這意味著,很多算法識別出來的實(shí)體和關(guān)系,離實(shí)用還有一定的距離。
舉例來說,和N2C2是醫(yī)療領(lǐng)域兩個(gè)著名的NLP競賽,前者側(cè)重于生物領(lǐng)域,后者關(guān)注臨床領(lǐng)域。從競賽歷史上提交的最佳任務(wù)結(jié)果來看,基本沒有實(shí)體和關(guān)系識別的F值達(dá)到90%以上的case。但是,在臨床和醫(yī)藥領(lǐng)域,很多時(shí)候?qū)鹊囊蟪^了99%。
在這里,我們得到了醫(yī)療知識圖譜的一個(gè)額外特征:以循證為基礎(chǔ),對精度有要求。
國內(nèi)外知識圖譜的差異
北大的醫(yī)療知識圖譜,是國內(nèi)比較早公布出來的知識圖譜。
(:8002)
最近,OMAHA組織出品的HITA中,也包含了一個(gè)以“藥物-適應(yīng)癥”為主的知識圖譜。它對外提供服務(wù),可惜對普通用戶并不免費(fèi)開放。
()
其他的醫(yī)療知識圖譜,雖然在網(wǎng)絡(luò)上能找到,卻鮮有公布出來可以使用的。
知識圖譜并非是一個(gè)全新的概念,從更學(xué)術(shù)的角度來說,它的本質(zhì)是 Web/ (語義網(wǎng)絡(luò))。
NCBI(美國國家生物信息中心)是一個(gè)為整個(gè)生物醫(yī)療領(lǐng)域提供基礎(chǔ)數(shù)據(jù)的機(jī)構(gòu)。它出品的UMLS、MESH和OBA就是語義網(wǎng)絡(luò)產(chǎn)品。比如,UMLS包含了種135種實(shí)體,54種關(guān)系,是一個(gè)不折不扣的醫(yī)療知識圖譜。
在《》中,其中有大量的資源是由NCBI或者其下屬機(jī)構(gòu)提供的。
(UMLS的部分語義網(wǎng)絡(luò)關(guān)系圖)