Ⅰ 網路信息檢索與利用
【內容簡介】
本書是根據教育部高等教育司組織編寫的《普通高等學校文科類專業大學計算機教學基本要求(2006版)》公共課的基本要求編寫的。
「網路信息檢索與利用」是一門面向多學科專業的公共課程,目的是滿足廣大信息用戶快速、准確、有效地獲取網路信息資源的需求,本書正是針對這一要求而編寫的。全書包括信息資源檢索基礎知識、網路信息資源檢索概論、基於搜索引擎的網路信息資源檢索、中文網路資料庫的檢索、西文網路資料庫的檢索、著名的學術評價檢索系統、特種文獻信息的網路檢索、數據與事實型信息的網路檢索、網路信息資源的綜合利用等9章內容,並在每一章內容中設計了大量的檢索示例,每章後設計了思考題和上機練習題,以方便教學和學生的實踐操作。
本書能夠滿足當前高等學校計算機公共課教學的基本要求,既可以作為高等學校各學科專業網路信息資源檢索課程的教材,也可以作為各類計算機應用技能社會培訓課程教材和廣大科研工作者掌握網路信息檢索方法與技巧的實用參考工具書。
【目錄信息】
第1章 信息資源檢索基礎知識
1.1 信息資源檢索概述
1.1.1 信息資源
1.1.2 信息資源檢索
1.1.3 信息檢索系統與資料庫
1.2 信息檢索語言
1.2.1 檢索語言的概念與功能
1.2.2 信息檢索語言的類型
1.3 信息資源檢索技術
1.3.1 傳統的信息資源檢索技術
1.3.2 新型的網路資源檢索技術
1.4 信息資源檢索的方法、途徑和步驟
1.4.1 信息資源檢索方法
1.4.2 信息資源檢索途徑
1.4.3 計算機信息檢索策略的制定與實施
1.5 信息資源檢索效果的評價
1.5.1 信息檢索效果的評價
1.5.2 信息檢索的意義
習題
<< 查看詳細目錄
【書摘】
第1章 信息資源檢索基礎知識
1.1 信息資源檢索概述
1.1.1 信息資源
3.文獻信息源的類型
1)按照信息源的加_丁程度劃分
文獻信息源的分類方法多種多樣,其中,按照加工的程度來劃分,文獻信息源可以分為:
(1)零次文獻。零次文獻是指尚未經過系統整理形成正式文獻的零散資料或最原始的記錄,如書信、手稿、筆記等。零次文獻與一次文獻的重大區別就是前者沒有形成正式文獻,沒有正式發表。零次文獻的主要特點是內容新穎,具有原始性,但不成熟、分散,難以獲得和檢索。
(2)一次文獻(primary 1iterature)。一次文獻義稱為原始文獻,是人們研究或創造性活動成果的直接記錄,一般指公開出版的著作、期刊論文、科技報告、會議文獻、學位論文、發明專利等。一次文獻記載的信息零碎、分散、無序,同時它也具有新穎性、創造性和系統性等特徵,參考和使用的價值較高。
(3)二次文獻(secondary literature)。二次文獻是指通過科學的方法,將分散無序的一次文獻經過篩選、分析、整理,按其內容特徵和外部特徵進行提煉、濃縮,編制而成的有系統的文獻。它包括目錄、文摘、索引等,它們是二次文獻的核心。
二次文獻的形成是從分散、無序到集中、有序化的書目控制過程,這種文獻具有濃縮性、匯集性、有序性等特點。二次文獻易於存儲、檢索、傳遞和使用,有較高的使用價值。
(4)三次文獻(tertiary literature)。三次文獻是系統地組織、綜合研究和分析一次和二次文獻的結果,是通過二次文獻提供的線索,對某一范圍的一次文獻進行分析、綜合研究、歸納、整理等深加工所生成的文獻,如述評、網路全書、專題報告、年鑒、手冊、字典等。三次文獻具有資料性和實用性,是對一次文獻進行濃縮、提煉、重新組織,內容有較大變化。
零次文獻信息源是最原始的信息資源,雖未公開交流,但它是生成一次文獻信息的主要素材;一次文獻信息源是最主要的信息資源,是人們檢索和利用的主要對象;二次文獻信息源是對一次文獻信息的集中提煉和有序化,是檢索一次文獻信息的丁具,故又稱檢索工具;三次文獻信息源是按知識門類或專題將一次文獻信息重新組織、高度濃縮而成,是人們查考數據信息和事實信息的主要信息源。
……
【相關資源】
· 程序員的7種武器(正則表達式、編程語言、資料庫、演算法、軟體調試、開發環境)
· 【推薦嵌入式學院相關就業培訓課程】(嵌入式Linux、Symbian手機開發、WinCE/Mobile開發、FPGA等)
網路信息檢索與利用 -所有相關信息
Ⅱ 網路信息檢索的基本策略是什麼
基於網路環境的信息檢索策略從計算機網路信息檢索的基本工作原理中我們可以容易看出,信息需求用戶輸入的檢索提問表達式必須和索引資料庫系統的記錄信息特徵標識相匹配才能准確檢索到需要的信息。
網路信息檢索策略設計應遵循快、准、全及低成本的原則,以實現檢索策略最優化。
1、明確檢索目標,確定檢索項
分析主題、使用布爾邏輯算符等構造檢索式
2、選擇合適的檢索系統
根據檢索主題和檢索系統的特點選擇檢索系統
3、正確對待檢索結果
對漏檢、錯檢、溢檢、無檢索結果的處理方式。
4、選擇最佳上網時間
選擇網速較快的時間段。
多數情況下,有一個好的搜索策略,能正確地應用布爾邏輯符,並熟悉每個搜索引擎的特性,就可得到一個好的檢索結果。除此之外,在某些情況下還可用其他的一些技巧來改善檢索結果。
1、擴大檢索范圍、提高查全率
2、縮小檢索范圍、提高查准率
3、Ctrl十F
用搜索引擎檢索到所需文檔並連接到相關網頁後,有時會發現所要的文件並沒有出現在當前視野中,這可能是因為文件存放在當前網頁的底部。一個快捷的方法就是按「Ctrl十F」在當前頁查找文件。
4、給檢索結果作標簽
避免再重復出現。
Ⅲ 網路信息檢索與利用的介紹
《網路信息檢索與利用》是朱紅編著的圖書,全面介紹了網路信息資源的檢索方法及其利用,共分為基礎篇、綜合篇、技巧篇、服務篇和實訓篇5個部分。《網路信息檢索與利用》可以作為高等院校理工科專業、經濟管理類專業的本專科生及研究生的信息檢索課程的教材,還可以作為科研人員的信息檢索參考書。
Ⅳ 網路信息檢索與聯機信息檢索最根本的不同是什麼
聯機信息檢索:用戶藉助通訊線路,通過終端設備同檢索系統聯機所進行的文獻與數據檢索。這種計算機系統一般設有較多的資料庫,而每個資料庫可以包括幾百萬條文獻的書目款目或科技數據。每檢索一個課題只需數十秒鍾,檢索到的題錄、文摘或數據還可立即在終端上顯示和列印出來。聯機檢索的實現,對於圖書館傳統的收集、查找與提供資料的方式來說,是一次革命。
網路信息檢索:指網際網路檢索,是通過網路介面軟體,用戶可以在一終端查詢各地上網的信息資源。這一類檢索系統都是基於互聯網的分布式特點開發和應用的,即:數據分布式存儲、用戶分布式檢索、數據分布式處理。
二者的不同點在於:
聯機檢索通過檢索軟體的運行從聯機信息中心資料庫查尋信息,檢索方法是通過終端設備輸入檢索詞或檢索策略進行檢索,而網路檢索從遠程機中獲取信息,網路信息檢索系統的檢索工具是搜索引擎;
聯機檢索需要通過使用終端設備,按照一定的檢索規則進行檢索,而網路檢索為用戶提供了良好的信息查詢界面:
聯機信息檢索的檢索費用較高,而網路信息檢索大多時候是不需要收費的:
聯機信息檢索的信息質量好,而網路信息檢索的信息存在著大量的垃圾信息,信息質量較低;
聯機信息檢索查准率高,而網路信息檢索查准率低。
Ⅳ 數據挖掘與信息檢索,網路安全發展及就業前景
網路前景不大,就那些東西。
信息檢索與數據挖掘不錯。都是資料庫層面,數據挖掘,分析,前景不錯
至於你們老師給推薦工作,這個建議你別放在心上,別想太多。沒用
還有大學本科學習的東西,比如組成原理,網路基礎、演算法、加密解密、數據結構,C語言,匯編,電路、操作系統這些東西,你一定要學,雖然目前你感覺沒啥用,但是我告訴你,如果你學的非常棒,那麼畢業之後,你想轉IT的任何一個分支都輕松加愉快,而且進步速度非常快
不要相信大學無用論,大學本科和專科一個最大的區別,就是本科一直在學看上去好像過時的東西,而且對就業沒有作用,專科學技術,上來就能幹活的。但是我告訴你,專科想轉別的分支或者提供自己非常難,但本科不一樣。。
其實你看看社會招聘,你就能感覺出來,小公司都是問你具體技術問題,比如怎麼寫一個jsp網頁等。但是想微軟、網路、這些大公司,不會問你怎麼寫jsp,他們只問你,怎麼實現數據結構,操作系統原理。演算法一類的問題。
所以大學要學好這些基礎。你說的那些資料庫啊,什麼的,都是應用層面的東西,跟word,excel一樣,
Ⅵ 什麼是網路信息檢索
主要指對利用Internet信息發布技術,通過Internet發布的信息進行的檢索,主要利用搜索引擎、網路機器人和門戶站點等來完成。
網際網路上有海量的數據,是信息的海洋,但在解決實際問題中,仍感到缺乏真正需要的信息,出現了數據豐富,信息貧乏的問題。如何在海量數據堆中,准確、快速的找到所需要的信息,是一個需要很好解決的重大問題。因此,網上信息檢索技術,為用戶從包含各種數據的文件堆中查找所需要的信息或知識的技術,便成為網際網路應用中的一個關鍵性問題。
作為信息海洋的網際網路,從瀏覽器上通過逐個網頁瀏覽尋找所要信息的方法,就像大海撈針一樣,不僅浪費大量的計算機時間和佔用網路通道資源,也很難找到真正需要的信息,利用信息檢索技術及為其開發的軟體系統才是唯一可行的方法。
信息檢索技術是將網際網路上的海量數據,通過軟體系統的檢索查詢,根據用戶提供的需求,把用戶所要的信息提取出來,經十多年發展已經取得了不少突破性的進展,發展了一大批有效、不同的信息檢索軟體,如文本信息檢索、動態網頁Web信息檢索、檢索引擎等一些重要的檢索方法和技術,特別是檢索引擎,成了Web上查找信息不可缺少的工具。
特點
由於網路信息檢索藉助網路通信、信息處理等技術的發展,與傳統信息檢索相比,網路信息檢索具有如下特點:
1.檢索范圍、領域涵蓋廣。網路信息檢索的信息來源范圍通常涵蓋全球,而信息資源類型、學科(主題)領域也幾乎無限制。
2.傳統檢索技術與網路檢索技術相結合。傳統的信息檢索核心檢索技術如布爾邏輯檢索、截詞檢索、限定檢索等檢索技術在網路信息檢索中被沿用。但是網路信息檢索技術藉助網路信息技術的發展,一些新的檢索技術也融入到網路信息檢索中,如人工智慧、數據挖掘、自然語言處理、多媒體檢索技術、多語言檢索技術等,如一些搜索引擎能將搜索結果進行自動分類。
3.用戶界面友好,容易上手。網路信息檢索所藉助的網路信息檢索工具均以面對非專業信息檢索的廣大網民為主,通過各種交換和智能技術,使得一般檢索基本能解決大部分問題。不需要專門的檢索技術和知識。不過,高級搜索就相對難一些。
4.信息檢索效率低。由於網路信息資源浩如煙海,信息資源良莠不齊等特點,信息檢索結果數量雖多,但是查准率較低,盡管一些新的技術如數據挖掘技術、自然語言理解技術等的不但發展和應用,但網路信息檢索效率低的狀況短時間內還無法改觀。
Ⅶ 結合自己的使用經驗,談談網路信息檢索的優勢與不足,以及對改進網路信息檢索效率有何自己的見解。
1。基於網頁的網路信息檢索工具的現狀和發展趨勢 1。1現狀。網頁是網際網路的最主要的組成部份,也是人們獲取網路信息的最主要的來源,為了方便人們在大量繁雜的網頁中找尋自己需要的信息,這類檢索工具發展的最快。
一般認為,基於網頁的信息檢索工具主要有網頁搜索引擎和網路分類目錄兩種。網頁搜索引擎是通過「網路蜘蛛」等網頁自動搜尋軟體搜索到網頁,然後自動給網頁上的某些或全部字元做上索引,形成目標摘要格式文件以及網路可訪問的資料庫,供人們檢索網路信息的檢索工具。
網路目錄則是和搜索引擎完全不同,它不會將整個網路中每個網站的所有頁面都放進去,而是由專業人員謹慎地選擇網站的首頁,將其放入相應的類目中。網路目錄的信息量要比搜索引擎少得多,再加上不同的網路目錄分類標准有些混亂,不便人們使用,因此雖然它標引質量比較高,利用它的人還是要比利用搜索引擎的人少的多。
但是由於網路信息的復雜性和網路檢索技術的限制,這類檢索工具也有著明顯的不足。(1)隨著網頁數量的迅猛增加,人工無法對其進行有效的分類、索引和利用。網路用戶面對的是數量巨大的未組織信息,簡單的關鍵詞搜索,返回的信息數量之大,讓用戶無法承受。
(2)信息有用性評價困難。一些站點在網頁中大量重復某些關鍵字,使得容易被某些著名的搜索引擎選中,以期藉此提高站點的地位,但事實上卻可能沒有提供任何對用戶有價值的信息
Ⅷ 網路信息檢索的方法有哪些分析這些方法的差異性及其各自的優勢
網路信息檢索方法主要有以下四種:1、漫遊法2、直接查找法3、搜索引擎法4、網路資源指南法1.漫遊法
(1)偶然發現。這是在網際網路上發現、檢索信息的原始方法。即在日常的網路閱讀、漫遊過程中,意外發現一些有用信息。這種方式的目的性不是很強,具不可預見性和偶然性。
(2)順「鏈」而行。指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網頁轉向另一相關網頁。此方法類似於傳統手工檢索中的「追溯檢索」,即根據文獻後所附的參考文獻追溯查找相關的文獻,從而不斷擴大檢索范圍。這種方法可能在較短的時間內檢出大量相關信息,也可能偏離檢索目標而一無所獲。
2.直接查找法
直接查找法是已經知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網址進行瀏覽查找的方法。此方法適合於經常上網漫遊的用戶。其優點是節省時間、目的性強、節省費用,缺點是信息量少。
3.搜索引穆檢索法
此方法是最為常規、普遍的網路信息檢索方法。搜索引擎是提供給用戶進行關鍵詞、片語或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在資料庫中進行檢索,並將檢索結果提供給用戶。它一般支持布爾檢索、片語檢索、截詞檢索、欄位檢索等功能。利用搜索引擎進行檢索的優點是:省時省力,簡單方便,檢索速度快、范圍廣,能及時獲取新增信息。其缺點是:由於採用計算機軟體自動進行信息的加工、處理,且檢索軟體的智能性不很高,造成檢索的准確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。 4.網路資源指南檢索法
此方法是利用網路資源指南進行查找相關信息的方法。
網路資源指南類似於傳統的文獻檢索工具————書目之書目(bibliography of bibliographies),或專題書目,國外有人稱之為web of webs,webliographies,其目的是可實現對網路信息資源的智能性查找。它們通常由專業人員在對網路信息資源進行鑒別、選擇、評價、組織的基礎上編制而成,對於有目的的網路信息檢索具有重要的指導作用。其局限性在於:由於其管理、維護跟不上網路信息的增長速度,使得其收錄范圍不夠全面,新穎性、及時性不夠強,且用戶還要受標引者分類思想的限制。參考資料:過仕明主編. 信息檢索概論. 黑龍江科學技術出版社, 2005.10
Ⅸ 網路信息檢索及其發展趨勢是什麼
一、智能化
智能化是網路信息檢索未來主要的發展方向。智能檢索是基於自然語言的檢索形式,機器根據用戶所提供的以自然語言表述的檢索要求進行分析,而後形成檢索策略進行搜索。用戶所需要做的僅僅是告訴計算機想做什麼,至於怎樣實現則無須人工干預,這意味著用戶將徹底從繁瑣的規則中解脫出來。近幾年來,智能信息檢索(intelligent information retrieval)作為人工智慧(AI)的一個獨立研究分支得到了迅速發展。在Internet技術迅速普及的今天,面向Internet的信息獲取與精化技術已成為當代計算機科學與技術領域中迫切需要研究的課題,將人工智慧技術應用於這一領域是人工智慧走向應用的一種新的契機與突破口。
二、可視化
可視化(visualization)的歷史可以追溯到2400多年前。哲學家柏拉圖指出,我們通過看來識別物體。據統計,人獲取信息有70%一80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像(visual)取代文字幫助人們檢索的優點在於:圖像的表達方式生動、形象、准確、效率更高,能從多角度揭示,而純文字的表達方式是模糊、一維的。
三、簡單化
未來家用電腦將朝著智能化、網路化、人性化和綠色環保的方向發展;操作系統的用戶友好性將不斷增強,如微軟和蘋果公司都在致力於操作系統網路化研究,以便使其中的任一應用程序都能「連接」進行「網路檢索」,並與網路「交互」;各搜索引擎檢索界面更加「傻瓜化」。使用戶學習和進行網路信息檢索更加容易;網上自動標引、自動文摘、自動跟蹤、自動漫遊、機器翻譯、多媒體技術、動態鏈技術、數據挖掘和信息推拉等技術逐步發展、完善,會越來越方便用戶及時准確地檢索信息。這些硬體與軟體技術的發展都有利於網路信息檢索的簡單化。
四、多樣化
多樣化首先表現在可以檢索的信息形態多樣化,如文本、聲音、圖像、動畫。目前網路信息檢索的主體是文本信息,基於內容的檢索技術和語音識別技術的發展,將使多媒體信息的檢索變得逐漸普遍。
多樣化的第二個表現是檢索工具向多國化、多語種化方向發展。網路的迅速發展,使得整個世界變成了地球村,世界各地上網人數的不斷增多,使得英語已無法滿足所有用戶的需要,語言障礙越來越明顯。
多樣化的第三個表現是網上檢索工具的服務多元化。網上檢索工具已不僅僅是單純的檢索工具,正在向其他服務范疇擴展,提供站點評論、天氣預報、新聞報道、股票點評、各種黃頁(如電話號碼)、航班和列車時刻表、地圖等多種面向大眾的信息服務、免費電子信箱,以多種形式滿足用戶的需要。無論是在國際上還是在國內,檢索工具都在朝多元化方向發展,為用戶提供全方位服務。
多樣化還表現在網路信息檢索可以間接地服務於其他行業。例如數據挖掘技
術可用於分析歷史數據的變化趨勢,預測未來發展方向,發現大量數據中潛在的模式規律,為投資、科研、項目評估等提供有力的依據;還可以系統地、定量地分析目前較為熱門的研究發展領域及查詢頻繁更新的文獻資料種類,可使信息中心、圖書館等信息服務機構不斷調整文獻資料及圖書的訂閱、收集工作,有的放矢,向以需求為驅動的方向發展,建立一套更為系統、科學的管理方式。
五、個性化
個性化指各網站注重內容的特色化和注重個性化的服務。
網路資源的指數級膨脹,使得用戶在獲得自己需要的信息資源時要花費大量的時間和精力。隨著互聯網的飛速發展,每個人的不同信息需求將凸現於標准化、單一的「大眾需求」之上,並成為各個搜朋夠或網站努力追求的對象。不同的打有消費者個人烙印的產品將成為某個消費者區別他人、感覺自我存在及獨特的外在標志,個性化服務成功的實質在於提供了真正適應用戶需要的產品,貫徹了以用戶為中心的理念。
六、商業化
網路檢索系統擁有全世界數量眾多的用戶,吸引了大量的廣告,為電子信息的增值服務提供了廣闊的空間。網路檢索系統已成為新的投資熱點。網路檢索系統不再僅僅是一種檢索工具,而且成為一項產業,它的商業利益成為推動系統完善和擴展的主要動力,網路信息的檢索與利用由公用性轉向商業化。美國著名的數字媒體評估公司Jupiter Media Metrix日前發布研究報告稱,「搜索引擎公司推出的付費添加服務是一個正在興起的、前景光明的網際網路領域,相對於目前低迷的在線廣告市場來說,它的發展潛力是非常巨大的。」