- 相關(guān)推薦
鏈接分析法——情報(bào)學(xué)研究新方法
內(nèi)容提要】本文認(rèn)為鏈接分析法是網(wǎng)絡(luò)信息計(jì)量學(xué)的重要研究方法,是情報(bào)學(xué)研究的新領(lǐng)域。它完善了情報(bào)學(xué)方法論體系,豐富了情報(bào)學(xué)理論,是情報(bào)學(xué)逐漸成熟的一個(gè)重要標(biāo)志。文章簡(jiǎn)單介紹了網(wǎng)絡(luò)信息計(jì)量學(xué),并對(duì)鏈接分析法進(jìn)行了分析。【摘 要 題】理論縱橫
【關(guān) 鍵 詞】鏈接分析法/網(wǎng)絡(luò)信息計(jì)量學(xué)/情報(bào)學(xué)/方法論……
【 正 文】
20世紀(jì)90年代以后,以數(shù)字化技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò)通訊技術(shù)綜合而成的現(xiàn)代信息技術(shù),引發(fā)了人類社會(huì)的第二次信息革命,人類業(yè)已邁入知識(shí)經(jīng)濟(jì)時(shí)代。新的社會(huì)環(huán)境使包括情報(bào)學(xué)在內(nèi)的學(xué)科研究發(fā)展面臨著新的挑戰(zhàn),我們需要新的理論和方法來(lái)加以研究和利用,情報(bào)學(xué)的傳統(tǒng)方法在面對(duì)新的問(wèn)題時(shí),就要進(jìn)行自身的轉(zhuǎn)化。如面對(duì)浩瀚的網(wǎng)絡(luò)信息資源,傳統(tǒng)的文獻(xiàn)計(jì)量學(xué)方法就顯得力不從心,相應(yīng)地網(wǎng)絡(luò)信息計(jì)量學(xué)(Webmetrics or Cybermetrics)就應(yīng)運(yùn)而生,用新的研究方法如鏈接分析法來(lái)描述和組織網(wǎng)絡(luò)信息世界。
1 網(wǎng)絡(luò)信息計(jì)量學(xué)
網(wǎng)絡(luò)信息計(jì)量學(xué)是在網(wǎng)絡(luò)信息環(huán)境下迅速形成和發(fā)展起來(lái)的,作為信息計(jì)量學(xué)的一個(gè)新的發(fā)展和重要的研究領(lǐng)域,它的出現(xiàn)使傳統(tǒng)的基于文獻(xiàn)和信息的文獻(xiàn)計(jì)量學(xué)、信息計(jì)量學(xué)面臨著新的變革。關(guān)于其定義主要有:網(wǎng)絡(luò)計(jì)量學(xué)是一門計(jì)算機(jī)科學(xué),是一門研究互聯(lián)網(wǎng)上數(shù)據(jù)相互引用的科學(xué),是一門對(duì)網(wǎng)絡(luò)文獻(xiàn)規(guī)律進(jìn)行統(tǒng)計(jì)分析的科學(xué),基于Web和軟件計(jì)量分析工具,集計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、計(jì)量學(xué)方法、統(tǒng)計(jì)學(xué)方法于一體,其應(yīng)用范圍覆蓋了所有基于網(wǎng)絡(luò)通信技術(shù)的信息測(cè)度。網(wǎng)絡(luò)計(jì)量學(xué)是綜合采用文獻(xiàn)計(jì)量、信息計(jì)量、統(tǒng)計(jì)學(xué)方法、計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)對(duì)網(wǎng)絡(luò)文獻(xiàn)規(guī)律進(jìn)行統(tǒng)計(jì)分析的一門科學(xué)。網(wǎng)絡(luò)信息計(jì)量學(xué)是采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)的各種定量方法,對(duì)網(wǎng)絡(luò)信息的組織、存儲(chǔ)、分布、傳遞、相互引證和開發(fā)利用進(jìn)行定量描述和統(tǒng)計(jì)分析,借以揭示網(wǎng)絡(luò)信息的數(shù)量特征和內(nèi)在規(guī)律的一門新興學(xué)科。它主要是由網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)管理、信息資源管理與信息計(jì)量學(xué)等相互結(jié)合、交叉滲透而形成的一門交叉性邊緣學(xué)科。
2 鏈接分析法研究現(xiàn)狀
2.1 鏈接分析法的內(nèi)容
鏈接分析法是網(wǎng)絡(luò)信息計(jì)量學(xué)中一個(gè)重要方法,它可以看成是文獻(xiàn)計(jì)量學(xué)中引文分析法在網(wǎng)絡(luò)環(huán)境中的應(yīng)用。網(wǎng)絡(luò)超文本通過(guò)鏈可以將結(jié)點(diǎn)鏈接起來(lái),一般使用兩種方法——索引鏈和結(jié)構(gòu)鏈進(jìn)行鏈接,它既可以表示信息之間的關(guān)系,又是構(gòu)成網(wǎng)絡(luò)的手段。在將網(wǎng)絡(luò)相關(guān)信息資源內(nèi)容鏈接起來(lái)形成新的信息鏈或信息集合的基礎(chǔ)上,融合了參考文獻(xiàn)鏈接功能,并通過(guò)引文關(guān)系來(lái)分析鏈接網(wǎng)絡(luò)信息資源的方法?梢园凑找贸潭群鸵脵(quán)威信息源來(lái)分析,在網(wǎng)絡(luò)信息組織、檢索、評(píng)價(jià)、服務(wù)等方面起著重要作用。
2.1.1 鏈接分析法在網(wǎng)絡(luò)信息組織方面的作用
網(wǎng)絡(luò)信息資源生產(chǎn)者如網(wǎng)頁(yè)創(chuàng)作者使用鏈接分析,創(chuàng)建一些對(duì)訪問(wèn)者有用的鏈接,可以鏈接到不同主題或相同主題質(zhì)量更優(yōu)秀的網(wǎng)頁(yè)。一般來(lái)說(shuō)鏈接類型大致有:合作鏈接(被鏈接網(wǎng)站和鏈接網(wǎng)站之間存在合作關(guān)系)、友情鏈接(網(wǎng)站之間可能由于在資源或其它相關(guān)方面有關(guān)系,相當(dāng)于影視術(shù)語(yǔ)中的友情客串)、推薦鏈接(被推薦網(wǎng)站由于質(zhì)量好、人氣旺、訪問(wèn)用戶多或是熱門網(wǎng)站等原因鏈接)、內(nèi)容鏈接(被鏈接網(wǎng)站和鏈接網(wǎng)站在內(nèi)容上存在著互補(bǔ)或相通關(guān)系等),可以起到網(wǎng)絡(luò)導(dǎo)航的作用,大大方便用戶在網(wǎng)上沖浪。Google還通過(guò)鏈接分析來(lái)確定網(wǎng)絡(luò)上的權(quán)威信息源來(lái)進(jìn)行相關(guān)的排名。Google認(rèn)為網(wǎng)頁(yè)制作者僅創(chuàng)建他們認(rèn)為重要的網(wǎng)頁(yè)的鏈接,鏈接到另外的網(wǎng)頁(yè)就像一本書的引文,網(wǎng)頁(yè)之間的這種引文關(guān)系“像是對(duì)網(wǎng)頁(yè)進(jìn)行評(píng)論的過(guò)程”。例如,網(wǎng)頁(yè)的制作者們創(chuàng)造了幾千個(gè)Yahoo的鏈接,困此Yahoo被當(dāng)作一個(gè)重要程度點(diǎn);如果許多重要的網(wǎng)頁(yè)都指向Yahoo,則其重要程度會(huì)更高。這種方法的好處是網(wǎng)頁(yè)制作者不可能誤導(dǎo)網(wǎng)站的排序,并且擴(kuò)展性極好——當(dāng)網(wǎng)絡(luò)增長(zhǎng)時(shí),產(chǎn)生更多的重要網(wǎng)頁(yè)的鏈接,自然更能確定該網(wǎng)頁(yè)是否是權(quán)威的信息源。
2.1.2 鏈接分析法在網(wǎng)絡(luò)信息檢索方面的作用
鏈接分析主要應(yīng)用于網(wǎng)絡(luò)信息檢索方面,如搜索引擎收集信息、檢索結(jié)果的排序等。網(wǎng)絡(luò)信息檢索為用戶提供海量信息多媒體數(shù)據(jù)庫(kù),采用超文本技術(shù)使檢索空間比傳統(tǒng)的信息檢索范圍更廣泛,以結(jié)點(diǎn)為單位組織,以超鏈接的方式鏈接相關(guān)內(nèi)容,更加符合人們的思維方式,打破了線性存儲(chǔ)的限制,真正實(shí)現(xiàn)多維檢索。Web信息檢索系統(tǒng)可以利用鏈接信息來(lái)優(yōu)化對(duì)相關(guān)文獻(xiàn)的查詢,能夠極大地提高檢索結(jié)果的相關(guān)性。在搜索引擎收集信息的過(guò)程中,J.Kleinberg認(rèn)為搜索引擎的Robots直接訪問(wèn)Web提取出權(quán)威頁(yè)(Authority Page)。但是如何提取出權(quán)威頁(yè),這需要一個(gè)原始積累和評(píng)價(jià)過(guò)程。先給出一批起始網(wǎng)頁(yè),Robot從這些源網(wǎng)頁(yè)開始收集,可以按照深度優(yōu)先或廣度優(yōu)先的算法進(jìn)行。當(dāng)網(wǎng)頁(yè)提取回來(lái)后,采用鏈接分析技術(shù)(具體用遞歸算法)來(lái)計(jì)算出權(quán)威頁(yè)。有了權(quán)威網(wǎng)頁(yè),Robot在收集Web信息時(shí),就有針對(duì)性地、高效率地訪問(wèn)Web網(wǎng)頁(yè)。搜索引擎檢索結(jié)果排序方面也運(yùn)用了鏈接分析技術(shù),由于索引數(shù)據(jù)庫(kù)容量大,若用戶輸入一個(gè)關(guān)鍵詞,有可能會(huì)有成千上萬(wàn)條記錄相匹配,搜索引擎對(duì)如此龐大的結(jié)果如何排序,如何把最相關(guān)的幾十條記錄顯示出來(lái)?搜索引擎按記錄號(hào)的順序提取結(jié)果集中的前幾十條記錄,再按鄰近圖(Neighbor Graph)算法對(duì)這幾十條記錄排序,最先顯示給用戶。這種檢索結(jié)果排序就是利用鏈接分析技術(shù),大大減輕了搜索引擎的負(fù)擔(dān),Yahoo、Google等搜索引擎就采用了超鏈接分析技術(shù)來(lái)對(duì)檢索結(jié)果排序。
2.1.3 鏈接分析法在網(wǎng)絡(luò)信息資源評(píng)價(jià)方面的作用
傳統(tǒng)的引文分析法在學(xué)術(shù)方面衡量學(xué)術(shù)期刊重要性的指標(biāo)之一是“影響因子”(IF),哪家期刊和論文被引用次數(shù)多,影響因子就高,誰(shuí)就被認(rèn)為是權(quán)威,論文也就是優(yōu)秀論文。在互聯(lián)網(wǎng)上IF對(duì)應(yīng)于統(tǒng)計(jì)指向某一網(wǎng)頁(yè)的鏈接數(shù)目后對(duì)該網(wǎng)頁(yè)作出的排序,網(wǎng)站引用分析對(duì)應(yīng)的是某個(gè)站點(diǎn)網(wǎng)頁(yè)被其它站點(diǎn)引用的情況的統(tǒng)計(jì)分析,也就是網(wǎng)頁(yè)可能被其它網(wǎng)站搜索提問(wèn)命中的結(jié)果數(shù)的多少,采用計(jì)分法和線性代數(shù)方法對(duì)中心網(wǎng)頁(yè)和權(quán)威網(wǎng)頁(yè)分?jǐn)?shù)進(jìn)行迭代求和,以確定權(quán)威網(wǎng)頁(yè)和中心網(wǎng)頁(yè)。這與百度搜索引擎的創(chuàng)始人李彥宏1996年提出的搜索引擎的第二定律:“人氣質(zhì)量定律”相一致。根據(jù)這一定律,用鏈接分析法進(jìn)行統(tǒng)計(jì)網(wǎng)站被鏈接和訪問(wèn)次數(shù),可以作為評(píng)價(jià)網(wǎng)站和網(wǎng)絡(luò)信息資源質(zhì)量的一個(gè)指標(biāo)。再加上相應(yīng)的鏈接文字分析,就可以用在搜索結(jié)果的排序上了,對(duì)搜索結(jié)果進(jìn)行的按相關(guān)性排序,不完全依賴于詞頻統(tǒng)計(jì),而是更多地依賴于超鏈分析。在Internet上鏈接關(guān)系反映的是網(wǎng)頁(yè)在全世界范圍內(nèi)、同一學(xué)科類屬的影響力,評(píng)價(jià)范圍是很廣的、甚至全球性的。目前主要利用搜索引擎工具在網(wǎng)絡(luò)上檢索網(wǎng)站和網(wǎng)頁(yè)的鏈接情況,并按相關(guān)性對(duì)檢索結(jié)果進(jìn)行排序,大
大方便了用戶在浩翰的信息海洋中迅速準(zhǔn)確地獲得有用的信息,易于操作、實(shí)用且可以節(jié)省用戶的時(shí)間,在一定程度上可以彌補(bǔ)同行評(píng)議等定性方法的缺陷。
2.2 鏈接分析法對(duì)情報(bào)學(xué)研究方法的意義
蘇聯(lián)科學(xué)家巴甫洛夫說(shuō)過(guò):“科學(xué)是隨著研究方法所取得的成就向前的。研究方法每前進(jìn)一步,隨之我們面前也就開拓了一個(gè)充滿種種新鮮事物的更遼闊的遠(yuǎn)景。”情報(bào)學(xué)是一門新興的綜合性邊緣學(xué)科,是一個(gè)開放的綜合性知識(shí)體系,它善于吸收其它相關(guān)學(xué)科的知識(shí)和研究方法。上世紀(jì)60年代后,隨著科學(xué)的日益發(fā)展,科學(xué)研究中應(yīng)用研究、實(shí)用研究和開發(fā)研究比重逐漸增大,情報(bào)學(xué)研究方法體系取得了長(zhǎng)足進(jìn)步,表現(xiàn)在:一是情報(bào)研究的領(lǐng)域、對(duì)象、內(nèi)容等的擴(kuò)大和深化;二是現(xiàn)代科學(xué)學(xué)科與方法的創(chuàng)立和發(fā)展。情報(bào)學(xué)研究方法體系是動(dòng)態(tài)的、發(fā)展的。情報(bào)學(xué)科要想在原有的基礎(chǔ)上實(shí)現(xiàn)學(xué)科研究模式的更新、學(xué)科結(jié)構(gòu)的變革和學(xué)科體系的拓展,就必須研究和采用新的思維方式和新的研究方法,及時(shí)反映最新的學(xué)科學(xué)術(shù)動(dòng)態(tài)和最新的理論學(xué)說(shuō),移植、借鑒其它學(xué)科的研究方法,如哲學(xué)方法、數(shù)學(xué)方法、社會(huì)學(xué)方法、經(jīng)濟(jì)學(xué)方法、信息技術(shù)方法等來(lái)豐富自己的研究方法,并加以創(chuàng)造和大膽創(chuàng)新,不僅引起自身學(xué)科結(jié)構(gòu)的變革和深化學(xué)科前沿的研究,而且不斷發(fā)展新的分支學(xué)科,促使學(xué)科研究充滿時(shí)代氣息。
鏈接分析法大大拓展了信息計(jì)量學(xué)在網(wǎng)絡(luò)環(huán)境下的應(yīng)用,充實(shí)了網(wǎng)絡(luò)信息計(jì)量學(xué)的內(nèi)容,是情報(bào)學(xué)研究的新領(lǐng)域,完善了情報(bào)學(xué)方法論體系。它是情報(bào)學(xué)逐漸成熟的一個(gè)重要?dú)v程碑,標(biāo)志著情報(bào)學(xué)理論方法的一個(gè)新的飛躍。
2.3 鏈接分析法目前存在的問(wèn)題
在文獻(xiàn)計(jì)量學(xué)中,傳統(tǒng)的引文分析法只要統(tǒng)計(jì)參考文獻(xiàn)數(shù)據(jù)就可完成引文分析的任務(wù),但是在互聯(lián)網(wǎng)上,鏈接分析法的研究對(duì)象是網(wǎng)絡(luò)信息資源,網(wǎng)絡(luò)信息資源覆蓋范圍廣、動(dòng)態(tài)性強(qiáng),具的信息量巨大、不確定性、缺乏合理組織、難以預(yù)測(cè)等特點(diǎn),且信息過(guò)載(Information Overload)和信息污染(Information Pollution)現(xiàn)象嚴(yán)重;引用與被引用關(guān)系也變得十分復(fù)雜;鏈接分析法的適用范圍也是有限的;Internet是在一個(gè)商業(yè)化的環(huán)境中發(fā)展起來(lái)的,一個(gè)網(wǎng)站的被鏈接數(shù)量還與它的商業(yè)推廣有著密切的聯(lián)系,因此這種評(píng)價(jià)體制在某種程度上缺乏客觀性。因此,在使用鏈接分析法時(shí)要充分考慮以上問(wèn)題,盡大可能保證其結(jié)果的可靠性。
3 結(jié)束語(yǔ)
由于鏈接分析法借鑒了引文分析法的方法和思路,是情報(bào)學(xué)研究方法在網(wǎng)絡(luò)環(huán)境下新應(yīng)用,目前鏈接分析法主要實(shí)驗(yàn)工具是搜索引擎,但隨著網(wǎng)絡(luò)信息技術(shù)如人工智能、網(wǎng)絡(luò)信息檢索、計(jì)算機(jī)網(wǎng)絡(luò)、知識(shí)挖掘、自然語(yǔ)言處理等的發(fā)展,必將為鏈接分析法的研究和開發(fā)應(yīng)用提供更為有力的支持。情報(bào)學(xué)也必將充分利用網(wǎng)絡(luò)信息技術(shù),吸收其它學(xué)科的先進(jìn)方法來(lái)深化、完善自己的方法論體系,建立起更為完善的體系結(jié)構(gòu),從而改變情報(bào)學(xué)學(xué)科的面貌。
【參考文獻(xiàn)】
1 徐久齡等.網(wǎng)絡(luò)計(jì)量學(xué)的研究.情報(bào)學(xué)進(jìn)展1998-1999年度評(píng)論,第三卷.北京:航空工業(yè)出版社,1999:78-105
2 夏旭等.網(wǎng)絡(luò)計(jì)量學(xué)研究:現(xiàn)狀、問(wèn)題與發(fā)展.圖書館論壇,2001,(12):44-47
3 鄒志仁.論情報(bào)研究方法體系.江蘇圖書館學(xué)報(bào),1990,(2):18-23
4 楊濤.鏈接分析法存在的問(wèn)題及改進(jìn)方法.圖書情報(bào)知識(shí),2002,(3):62-63
5 劉雁書,方平.Web網(wǎng)站站外鏈接類型與特征調(diào)查-鏈接分析法可行性研究.大學(xué)圖書館學(xué)報(bào),2001,(5):65-68
6 鄒菲.試論網(wǎng)絡(luò)信息計(jì)量學(xué)在數(shù)字圖書館中的應(yīng)用.圖書情報(bào)知識(shí),2001,(1):16-17,20
7 邱均平.信息計(jì)量學(xué)(一).情報(bào)理論與實(shí)踐,2000,(1)
8 鄒曼莉.國(guó)外網(wǎng)絡(luò)信息檢索的最新進(jìn)展.圖書館雜志,2002,(2):67-70
9 J.Kleinberg.Authoritative Sources in a Hyperlinked Environment. Proc.Ninth ACM-SIAM Symp.Discrete Algorithm,ACM Press. New York.1998
【鏈接分析法——情報(bào)學(xué)研究新方法】相關(guān)文章:
情報(bào)學(xué)的經(jīng)濟(jì)學(xué)化研究歷程及其發(fā)展展望08-05
我國(guó)內(nèi)容分析法的研究進(jìn)展08-05
鏈接出神奇08-16
人才與產(chǎn)業(yè)“無(wú)縫鏈接”08-17
讓校本培訓(xùn)與有效鏈接08-17