- 相關(guān)推薦
聚類算法及其在護(hù)理管理中的應(yīng)用研究
摘 要:在傳統(tǒng)的醫(yī)療過程中,醫(yī)護(hù)人員隨機(jī)分配,患者被動(dòng)接受治療的護(hù)理管理模式不僅會浪費(fèi)有限的醫(yī)療資源,使患者承受較高醫(yī)療費(fèi)用,有時(shí)還會延誤最佳治療時(shí)機(jī),引發(fā)并發(fā)癥,給患者和其家庭帶來更多的痛苦和困擾。文章通過將幾種常見的聚類算法在護(hù)理管理中的應(yīng)用進(jìn)行比較,最終選擇了先驗(yàn)假設(shè)較少的層次聚類算法,基于R語言探討了層次聚類算法分類護(hù)理患者的實(shí)現(xiàn)過程,說明了層次聚類算法在患者與護(hù)理資源的最優(yōu)匹配中的應(yīng)用方法,為醫(yī)院開展科學(xué)護(hù)理管理提供一定的參考依據(jù)。
關(guān)鍵詞:聚類算法;護(hù)理管理;層次
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A
Abstract:In the process of traditional healthcare,health care providers are randomly assigned and patients are passive to accept various treatments.Besides the high expense of medical treatment and the waste of limited medical resources,it would delay the best treatment time and cause complications,bringing great suffering to patients and their families.By comparing clustering algorithms,this paper chooses the hierarchical clustering algorithm with fewer priori assumptions.Based on R Language,this paper elaborates on the implementation process of hierarchical clustering algorithm in clustering patients,and the methods of using hierarchical algorithm to optimally match the patients and nursing resources,thus providing certain reference and basis to the scientific nursing management.
Keywords:clustering algorithm;nursing management;hierarchical
1 引言(Introduction)
護(hù)理管理是醫(yī)療機(jī)構(gòu)以改善和提高醫(yī)療水平,合理利用醫(yī)療設(shè)備,最大程度發(fā)揮醫(yī)護(hù)人員護(hù)理能力為目標(biāo)的過程。然而,在傳統(tǒng)的醫(yī)療護(hù)理管理過程中,醫(yī)護(hù)人員隨機(jī)分配,患者被動(dòng)接受治療方案,不僅會浪費(fèi)醫(yī)療資源,使患者承受較高醫(yī)療費(fèi)用,有時(shí)還會延誤治療,引發(fā)并發(fā)癥,給患者和其家庭帶來更多痛苦和困擾。隨著信息化“智慧醫(yī)療”時(shí)代的到來,醫(yī)院信息系統(tǒng)的普及,醫(yī)療數(shù)據(jù)采集、整理、分析不再受到傳統(tǒng)人工操作在時(shí)間、效率、成本和療效等方面的制約,取而代之的是高效、便捷、智能、科學(xué)的大數(shù)據(jù)分析處理過程!盎ヂ(lián)網(wǎng)+醫(yī)療護(hù)理”的模式已悄然走近我們身邊。許多學(xué)者開始嘗試通過計(jì)算機(jī)算法精準(zhǔn)識別患者、最優(yōu)分配護(hù)理醫(yī)生、優(yōu)化患者轉(zhuǎn)診流程等方式來提高護(hù)理效果和降低醫(yī)療費(fèi)用。在識別患者和分配醫(yī)生時(shí),為了更好地進(jìn)行分類識別,聚類算法受到了廣泛關(guān)注。
2 聚類算法(Clustering algorithm)
聚類就是按照“物以類聚”的思想,將抽象數(shù)據(jù)集劃分成若干簇的過程,其中在每一簇中數(shù)據(jù)間具有高度的相似性[1,2]。聚類分析是當(dāng)前數(shù)據(jù)挖掘中的重要手段。迄今,研究者已提出了多種聚類算法[3]。常用的聚類算法有基于劃分、密度、網(wǎng)格、模型和層次的方法等[4]。
2.1 基于劃分的聚類方法
基于劃分的聚類方法需要提前設(shè)定聚類的數(shù)目,如K均值法和K中心點(diǎn)法等。這類方法分析時(shí)需要首先在數(shù)據(jù)集中隨機(jī)選擇聚類數(shù)目的對象,每個(gè)對象作為該聚類的中心或平均值,通過距離遠(yuǎn)近等方法將其余對象逐步聚類到每個(gè)類中;趧澐值木垲惙治鼋Y(jié)果與初始值關(guān)系非常密切,不同的初始值往往會導(dǎo)致不同的聚類結(jié)果,通常會呈現(xiàn)出局部最優(yōu)解。基于這種情況,基于劃分的聚類方法在實(shí)際應(yīng)用中往往要求窮舉所有可能的劃分。
2.2 基于密度的聚類方法
基于密度的聚類分析依據(jù)數(shù)據(jù)是否屬于相連的密度域?qū)?shù)據(jù)對象進(jìn)行歸類。常用的基于密度的聚類算法為DBSCAN。這種聚類方法可以剔除噪聲點(diǎn),同時(shí)可以發(fā)現(xiàn)任意形狀的聚類而不局限于球狀的類[5]。但DBSCAN必須指定鄰域半徑和最少點(diǎn)數(shù)這兩個(gè)參數(shù),同時(shí)聚類的結(jié)果對這兩個(gè)參數(shù)的依賴性很強(qiáng)。
2.3 基于網(wǎng)格的聚類方法
基于網(wǎng)格的聚類方法將空間分成有限數(shù)目的多維網(wǎng)格,利用網(wǎng)格結(jié)構(gòu)實(shí)現(xiàn)聚類。如CLIQUE算法和STING算法。CLIQUE算法主要適用于處理高維數(shù)據(jù),同時(shí)它綜合了密度算法,可以發(fā)現(xiàn)其中的密集聚類。STING算法是一種將空間劃分成直方形網(wǎng)格單元,不同方形對應(yīng)不同分辨率,以實(shí)現(xiàn)聚類分析的方法[6]。
2.4 基于模型的聚類算法
基于模型的聚類算法是通過尋找數(shù)據(jù)對每個(gè)類預(yù)先設(shè)置好的模型的最佳擬合而實(shí)現(xiàn)的。最典型的基于模型的聚類算法是COBWEB算法。COBWEB算法不需要用戶提供參數(shù),可以自動(dòng)劃分簇的數(shù)目[7]。
2.5 基于層次的聚類算法
基于層次的聚類算法對數(shù)據(jù)集按照凝聚或分裂的層次方式進(jìn)行聚類。凝聚型將每個(gè)對象看作一個(gè)單獨(dú)的類,然后通過合并相近的類實(shí)現(xiàn)聚類。分裂型將所有數(shù)據(jù)歸到一個(gè)類中,然后通過迭代,分層分裂成小類。常見的基于層次的聚類算法有CURE、ROCK和Chamelemon。Chamelemon算法在合并類的過程中,可以綜合考慮類的內(nèi)在特征、近似度和互連性,可以構(gòu)造任意大小的聚集簇[8]。
2.6 幾種聚類算法比較分析
基于模型的聚類算法要求對象在每個(gè)屬性具有獨(dú)立的概率分布,但在實(shí)際生活中,這種假設(shè)是不存在的。基于網(wǎng)格的聚類算法需要選擇合適大小的單元數(shù)目,基于密度的聚類算法和基于劃分的聚類算法需要用戶設(shè)置一定的參數(shù)來產(chǎn)生可接受的聚類結(jié)果。在基于層次的聚類算法中,執(zhí)行合并或分裂后無法回退修正,其質(zhì)量受到一定的影響,但由于層次聚類算法無需提前知道最終所需的集群數(shù)量,其先驗(yàn)假設(shè)較少,因此通用性很強(qiáng)。目前,層次聚類算法已廣泛應(yīng)用于各個(gè)領(lǐng)域。
3 護(hù)理管理中聚類算法的應(yīng)用研究(The application of clustering algorithm in Nursing management)
3.1 算法選擇
在護(hù)理管理中,聚類可以幫助科研人員從醫(yī)院信息管理系統(tǒng)中區(qū)分患者,聚類分析作為數(shù)據(jù)挖掘的重要分析方法,可以發(fā)現(xiàn)每類患者更深層次的信息,歸納總結(jié)出每類患者的個(gè)體特征和臨床檢驗(yàn)特征,有針對性的為患者提供精準(zhǔn)治療,減輕患者心理和財(cái)力方面的負(fù)擔(dān),縮短就醫(yī)療程,提高患者的生活質(zhì)量。根據(jù)患者個(gè)體參數(shù)合理聚類患者往往不同于其他領(lǐng)域聚類分析。首先,患者的個(gè)體特征屬性并不滿足獨(dú)立的概率分布。患者某項(xiàng)指標(biāo)的偏離往往依賴于其他體征。其次,護(hù)理管理初期通過設(shè)置一定的參數(shù)來產(chǎn)生可接受的聚類結(jié)果,需要具備豐富的醫(yī)學(xué)經(jīng)驗(yàn)和較高的計(jì)算機(jī)理論水平,實(shí)際應(yīng)用中難度很大。再者,患者病情差異較大,選擇合適大小的單元數(shù)目可操作性較低。綜合分析幾種聚類算法,層次聚類算法需要的先驗(yàn)假設(shè)更少,對患者的聚類集群更科學(xué),更適合當(dāng)前大數(shù)據(jù)背景下醫(yī)院開展科學(xué)、高效的護(hù)理管理,因此本文基于凝聚型層次聚類算法探討聚類算法在護(hù)理管理中的應(yīng)用。
3.2 數(shù)據(jù)預(yù)處理
護(hù)理管理中我們收到的患者數(shù)據(jù)往往具有異構(gòu)性、冗余性、復(fù)雜性等特征,在對數(shù)據(jù)進(jìn)行分析時(shí)首先需要進(jìn)行集成、清理和歸約[9]。
數(shù)據(jù)集成:患者個(gè)體數(shù)據(jù)來源主要有幾個(gè)方面:(1)醫(yī)學(xué)檢驗(yàn)中心;(2)體檢中心;(3)急診科室;(4)門診科室;(5)住院科室;(6)醫(yī)學(xué)影像診斷中心;(7)社區(qū)衛(wèi)生服務(wù)中心;(8)縣級醫(yī)院;(9)?漆t(yī)院。不同的醫(yī)療機(jī)構(gòu)對數(shù)據(jù)的存儲格式、方法和實(shí)體的命名規(guī)則不同,在數(shù)據(jù)集成過程中需要考慮統(tǒng)一實(shí)體、刪除冗余數(shù)據(jù)、處理沖突數(shù)據(jù)等。集成過程中可以考慮可視化分析和相關(guān)性分析等方法實(shí)現(xiàn)。
數(shù)據(jù)清理:由于醫(yī)療數(shù)據(jù)的特殊性,臨床檢驗(yàn)數(shù)據(jù)獲取時(shí)間較長,人工填補(bǔ)缺失值困難大,而替代鄰近值處理噪聲數(shù)據(jù)又可能導(dǎo)致分析結(jié)果的不準(zhǔn)確性,因此清理數(shù)據(jù)主要通過識別異常值并刪除相應(yīng)元組的方法實(shí)現(xiàn)。
數(shù)據(jù)歸約:隨著大數(shù)據(jù)時(shí)代的到來,可獲得的患者個(gè)體數(shù)據(jù)越來越多,對患者屬性進(jìn)行歸約處理可以有效地降低分析的時(shí)間復(fù)雜度,提高分析質(zhì)量。因此,在分析過程中可以通過屬性約簡等方法歸約處理數(shù)據(jù)。
3.3 基于R語言的層次聚類算法及其在護(hù)理管理中的應(yīng)用
在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,將每個(gè)患者視為一類,利用歐幾里得距離、曼哈頓距離、切比雪夫距離等方法計(jì)算出每類之間的相似度。接著,將相似度最高的合并為一個(gè)類,重復(fù)計(jì)算,直至相似度大于某個(gè)終止條件值時(shí)結(jié)束聚類。簡言之,層次聚類算法是通過計(jì)算每個(gè)類中的數(shù)據(jù)點(diǎn)與所有數(shù)據(jù)點(diǎn)之間的距離來確定其相似性,距離越小,相似度越高[10]。在R語言中,具體實(shí)現(xiàn)步驟如下:
(1)計(jì)算距離矩陣:利用dist()函數(shù)計(jì)算患者間的距離矩陣。
d<-dist(x,method=”euclidean”)
其中,x為患者數(shù)據(jù)集,method表示計(jì)算距離的方法,常用的方法有euclidean、manhattan、maximum等。方法的選擇可根據(jù)患者具體數(shù)據(jù)而不同。
(2)聚類分析:在距離矩陣的基礎(chǔ)上,使用hclust( )函數(shù)合并聚類簇。
hc<-hclust(d,method=“ward.D2”)
其中,d為患者數(shù)據(jù)的距離矩陣,method表示合并的方法,常用的方法有complete、ward、median、average、centroid等。
(3)剪枝操作:在數(shù)據(jù)分析中,患者數(shù)據(jù)的層次聚類結(jié)果有時(shí)很復(fù)雜,cutree()函數(shù)可以實(shí)現(xiàn)對聚類結(jié)果的剪枝操作,分析時(shí)可綜合層次聚類結(jié)果和醫(yī)生數(shù)選擇合適的聚類數(shù)。
clusterCut<-cutree(hc,k)
其中,k為層次聚類結(jié)果的指定聚類數(shù)。最佳聚類數(shù)的選擇是層次聚類剪枝中最復(fù)雜的一個(gè)問題,可以使用mclust、Nbclust、factoextra等包計(jì)算出最優(yōu)聚類數(shù)。
4 護(hù)理管理分析(The analysis of Nursing
management)
在實(shí)際護(hù)理管理中,廣義上講護(hù)理管理人員涵蓋的范圍不僅包括醫(yī)院護(hù)士、家庭護(hù)理人員[11],還包括專家和醫(yī)生。傳統(tǒng)的護(hù)理管理中,專家、住院醫(yī)生、護(hù)士隨機(jī)分配和組合,往往會產(chǎn)生不同的治療效果和醫(yī)療費(fèi)用。為了改善這一現(xiàn)狀,部分學(xué)者開始探討優(yōu)化護(hù)理流程、改善護(hù)理模式來提高護(hù)理質(zhì)量。但這些方法雖然在某種程度上改善了護(hù)理質(zhì)量,但護(hù)理方法的針對性較差。因此,在護(hù)理管理分析中,可以考慮事先仿真不同醫(yī)生對每位患者的治療效果。使用聚類分析方法,將患者進(jìn)行科學(xué)分類,綜合聚類結(jié)果、患者最終的治愈情況和醫(yī)療費(fèi)用,發(fā)現(xiàn)每類患者的最佳護(hù)理者,從而為醫(yī)院開展科學(xué)護(hù)理管理提供一定的參考依據(jù)。
5 結(jié)論(Conclusion)
隨著“互聯(lián)網(wǎng)+醫(yī)療護(hù)理”的發(fā)展,信息化技術(shù)在醫(yī)學(xué)中的運(yùn)用一定會越來越普及,越來越智能。我們探討基于R語言的層次聚類算法在護(hù)理中的應(yīng)用,就是要充分發(fā)揮層次聚類算法的先驗(yàn)假設(shè)較少的優(yōu)點(diǎn),可以直接對患者進(jìn)行科學(xué)分類,達(dá)到患者與護(hù)理資源的最優(yōu)匹配,既有效提高臨床護(hù)理效率和效果,又能節(jié)省有限的醫(yī)療人力、物力、財(cái)力,最終達(dá)到醫(yī)患關(guān)系的和諧融洽,相信隨著互聯(lián)網(wǎng)時(shí)代的到來,人工智能、計(jì)算機(jī)算法必將滲透到醫(yī)療護(hù)理的每一個(gè)環(huán)節(jié),深入學(xué)習(xí)探討各種算法在臨床護(hù)理實(shí)際中的運(yùn)用,將具有較大的科研和現(xiàn)實(shí)意義。
參考文獻(xiàn)(References)
[1] 王有為,吳迪.聚類技術(shù)在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用[J].河南教育學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,2:32-35.
[2] 李雪梅,張素琴.數(shù)據(jù)挖掘中聚類分析技術(shù)的應(yīng)用[J].武漢大學(xué)學(xué)報(bào),2009,42(3):396-399.
[3] 陳黎飛,姜青山,王聲瑞.基于層次劃分的最佳聚類數(shù)確定方法[J].軟件學(xué)報(bào),2008,19(1):62-72.
[4] Jiawei Han,MichelineKamber.范明,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2004:1-262.
[5] 楊海斌.一種新的層次聚類算法的研究與應(yīng)用[D].蘭州:西北師范大學(xué),2011:8.
[6] 張鑫.層次聚類算法的研究與應(yīng)用[D].贛州:江西理工大學(xué),2008:19.
[7] 段明秀.層次聚類算法的研究及應(yīng)用[D].長沙:中南大學(xué),2009:9.
[8] 畢鵬.改進(jìn)的Chameleon層次聚類算法在目標(biāo)分群中的應(yīng)用研究[D].杭州:浙江大學(xué),2009:17.
[9] 尤婷婷.健康大數(shù)據(jù)預(yù)處理技術(shù)及其應(yīng)用[D].成都:電子科技大學(xué),2017:6-16.
[10] 張良均,謝佳標(biāo),楊坦等.R語言與數(shù)據(jù)挖掘[M].北京:機(jī)械工業(yè)出版社,2017(8):204-206.
[11] Katie M.Dean,Laura A.Hatfield,et al.Preliminary Data on a Care Coordination Program for Home Care Recipients[J].The American Geriatrics Society,2016(64):1900-1903.
作者簡介:
降 惠(1983-),女,碩士,副教授.研究領(lǐng)域:醫(yī)學(xué)計(jì)算機(jī)應(yīng)用,數(shù)據(jù)挖掘.
【聚類算法及其在護(hù)理管理中的應(yīng)用研究】相關(guān)文章:
游戲教學(xué)在幼教中的應(yīng)用研究論文08-24
地圖在初中地理教學(xué)中的應(yīng)用研究08-25
B2C電商企業(yè)中整合營銷傳播概述及其應(yīng)用研究08-18
聚成企業(yè)管理培訓(xùn)心得03-13
博客在初中語文教學(xué)中的應(yīng)用研究08-20
數(shù)學(xué)史在中職數(shù)學(xué)教學(xué)中的應(yīng)用研究08-18
人工智能在知識付費(fèi)產(chǎn)業(yè)中的應(yīng)用研究08-19
行動(dòng)學(xué)習(xí)在CI設(shè)計(jì)課程教學(xué)中的應(yīng)用研究教育陣地08-24
聚優(yōu)秀作文08-27