版權歸原作者所有,如有侵權,請聯(lián)系我們

[科普中國]-信息檢索系統(tǒng)

科學百科
原創(chuàng)
科學百科為用戶提供權威科普內(nèi)容,打造知識科普陣地
收藏

發(fā)展

信息檢索工具的發(fā)展從無到有,經(jīng)歷了手工、自動化、計算機檢索、計算機網(wǎng)絡檢索這4個主要階段。

1.手工階段

所謂手工檢索工具,信息載體基本上是以紙質為主,其工具本身是某類形式的印刷出版物,以手工進行查閱,從而得到所需的文獻。這種方式經(jīng)歷了相當長的歷史時期,大約有2 000多年的時間,雖然后期出現(xiàn)了縮微(膠片)型的檢索工具,但基本上還是通過手工來完成檢索任務手工檢索工具種類繁多,功能也比較齊全,各種文摘、題錄、書目、索引等都屬于手工檢索工具。到今天為止,手工檢索工具還在發(fā)揮著很重要的作用。

2.自動化階段

隨著科學技術的發(fā)展,文獻量隨之增長,特別是到了20世紀三四十年代,自然科學的發(fā)展進入了一個前所未有的歷史時期,老的學科得到了迅速發(fā)展,同時涌現(xiàn)出了很多新的學科,出版的刊物也隨之大量增加,文獻量急劇增長,依靠原有的手工檢索方法往往要花去大量的時間,還不一定得到滿意的檢索效果。為了提高檢索效率,人們開始利用光電技術、機械技術,設計制造了檢索工具。但這種檢索工具還沒有廣泛地推開,就被計算機檢索系統(tǒng)所代替了。在我國沒有經(jīng)歷這一過程,就直接進入了計算機檢索階段,更確切地說是進入了計算機網(wǎng)絡檢索階段。

3.計算機檢索階段

以計算機技術為主的現(xiàn)代信息技術的發(fā)展是計算機信息檢索進步的基礎。1946年第一臺電子計算機誕生以后不久,就將其用于了信息檢索,開創(chuàng)了現(xiàn)代信息檢索的先河。自那以后,出現(xiàn)了一系列信息存儲與檢索的新理論和新方法,已經(jīng)逐漸成為一門獨立的科學分支。從單機批處理時期(20世紀50年代初至60年代中期),聯(lián)機檢索試用時期(60年代中期至70年代中期),一直到聯(lián)機服務系統(tǒng)(70年代中期至80年代中期)。信息存儲介質也從磁帶、磁盤到光盤,發(fā)生根本性的變化,其存儲模式也從文件形式發(fā)展到以數(shù)據(jù)庫為核心。從系統(tǒng)結構來看,從脫機檢索發(fā)展到聯(lián)機檢索,基本上是與計算機技術的發(fā)展相并行的。

早在20世紀50年代初期,美國麻省理工學院的P.R.Bagley就開始利用計算機檢索進行代碼化文摘的可行性研究實驗。1954年,美國馬里蘭州銀泉海軍軍械試驗室利用IBM701型電子計算機,將文獻號和少量標引詞存儲在計算機中,進行相關性比較后輸出檢索結果——文獻號,由此誕生了世界上第一個文獻信息的自動化檢索系統(tǒng)。由于當時的計算機尚處在電子管時期,用于信息處理有很大的局限,因此無實用系統(tǒng),而且是脫機檢索。

20世紀50年代末到60年代初,由子第2代計算機(半導體)的軟硬件有了發(fā)展,文獻處理與信息檢索的性能增強,信息檢索進入到實用化的脫機批處理階段。1959年,美國的勞恩利用IBM 650型計算機建立了世界上第一個基于KWIC關鍵詞索引的定題檢索SDI系統(tǒng)。1961年,美國《化學文摘》社使用計算機編制《化學題錄》(Chemical Title),并發(fā)行《化學題錄》機讀磁帶版。自此以后,計算機信息存取在世界范圍內(nèi)正式進入到實際應用與生產(chǎn)型開發(fā)的新時期。1967年以后,美國《化學文摘》社整個系列的新出版物都通過機讀數(shù)據(jù)庫進行生產(chǎn)了。1963年,美國系統(tǒng)發(fā)展公司受國防部委托開始研制ORBIT計算機存取系統(tǒng)并獲得成功。1964年,美國國家醫(yī)學圖書館也開始使用計算機編制世界醫(yī)學文獻的檢索刊物《醫(yī)學索引》(Index Medics)并投入使用。

到了20世紀60年代后期,由于第3代集成電路計算機的誕生與高密度海量存儲器硬磁盤及磁盤機的問世,以及數(shù)字通信技術和分組交換公用數(shù)據(jù)通信網(wǎng)的普及,使計算機信息存取從脫機批處理進入到聯(lián)機檢索階段。最早的聯(lián)機信息存取系統(tǒng)是美國洛克希德(Lockheed)公司研究試驗室研制的CONVERS系統(tǒng),該系統(tǒng)經(jīng)過不斷試驗與改進以后,于1966年改名為DIALOG,1967年開始為NASA提供常規(guī)檢索服務。2

目標狹義地講,信息檢索系統(tǒng)的目標是使特定的信息用戶能夠在特定的時間和地點、以特定的方式和方法獲得特定的信息,從而滿足其信息需求。換句話說,在用戶給出查詢后,信息檢索系統(tǒng)的首要目標就是檢索出可能對用戶有用或相關的信息。廣義地講,信息檢索系統(tǒng)的目標是將作者表達的思想與用戶對該思想的需求進行匹配,即在信息創(chuàng)造者或生成者與該信息的用戶之間建起橋梁。3

職能(1)存儲職能。把有關信息的學科內(nèi)容特征和外部特征著錄下來,按一定次序排列組織起來,以便于查找各類信息資源。

(2)檢索職能。提供一定的檢索手段,使人們按照一定的檢索方法,及時、準確、全面地查找出所需信息資源。

(3)報道職能。揭示某一時期、某一范圍信息資源的發(fā)展狀況。通過檢索系統(tǒng)對信息資源的報道,了解學科的歷史、現(xiàn)有水平和未來發(fā)展趨勢。

分類1、按照檢索的功能劃分

可以分為書目檢索系統(tǒng)事實數(shù)據(jù)檢索系統(tǒng),書目檢索系統(tǒng)主要是對某一研究課題的相關義獻進行檢索,其結果是獲得一批相關文獻的線索,其檢索作業(yè)的對象是檢索工具。事實數(shù)據(jù)檢索系統(tǒng)用于各種事實或數(shù)據(jù)的檢索.如查找某一詞的解釋,某人、某時間、某地名、某企業(yè)及其產(chǎn)品情況等.其結果是獲得直接的、可供參考的答案。進行事實數(shù)據(jù)檢索時.使用各種參考工具.如字典、百科全書、年鑒、手冊、名錄或者相應的數(shù)據(jù)庫。

2、 按照檢索的手段劃****分

可以分為手工檢索系統(tǒng)計算機檢索系統(tǒng)。手工檢索系統(tǒng)是以手工方式存儲和檢索信息的系統(tǒng)。檢索時使用各種紙質工具.檢索入口少、速度慢、效率低。計算機檢索系統(tǒng)是用計算機進行信息存儲和檢索的系統(tǒng),檢索時使用各種數(shù)據(jù)庫,檢索靈活、檢索入口多、速度快、效率高。由于計算機檢索具有速度快、效率高、數(shù)據(jù)內(nèi)容新、范圍廣、數(shù)量大、操作簡便、檢索時不受國家和地理位置的限制等特點,已成為人們獲取信息的主要手段之一。1

結構1.物理結構

信息檢索系統(tǒng)的物理結構是信息檢索所用的硬件資源(如計算機、網(wǎng)絡)、系統(tǒng)軟件(如Windows系列軟件)及信息資源集合(數(shù)據(jù)庫)的總和。

2.邏輯結構

信息檢索系統(tǒng)的邏輯結構指系統(tǒng)所包括的功能模塊或子系統(tǒng)及其相互關系。包括信息資源選擇與采集子系統(tǒng)、信息標引子系統(tǒng)、詞表管理子系統(tǒng)、數(shù)據(jù)庫創(chuàng)建與維護子系統(tǒng)、提問處理子系統(tǒng)和用戶檢索接口子系統(tǒng)。4