Ⅰ 网络信息检索与利用
【内容简介】
本书是根据教育部高等教育司组织编写的《普通高等学校文科类专业大学计算机教学基本要求(2006版)》公共课的基本要求编写的。
“网络信息检索与利用”是一门面向多学科专业的公共课程,目的是满足广大信息用户快速、准确、有效地获取网络信息资源的需求,本书正是针对这一要求而编写的。全书包括信息资源检索基础知识、网络信息资源检索概论、基于搜索引擎的网络信息资源检索、中文网络数据库的检索、西文网络数据库的检索、著名的学术评价检索系统、特种文献信息的网络检索、数据与事实型信息的网络检索、网络信息资源的综合利用等9章内容,并在每一章内容中设计了大量的检索示例,每章后设计了思考题和上机练习题,以方便教学和学生的实践操作。
本书能够满足当前高等学校计算机公共课教学的基本要求,既可以作为高等学校各学科专业网络信息资源检索课程的教材,也可以作为各类计算机应用技能社会培训课程教材和广大科研工作者掌握网络信息检索方法与技巧的实用参考工具书。
【目录信息】
第1章 信息资源检索基础知识
1.1 信息资源检索概述
1.1.1 信息资源
1.1.2 信息资源检索
1.1.3 信息检索系统与数据库
1.2 信息检索语言
1.2.1 检索语言的概念与功能
1.2.2 信息检索语言的类型
1.3 信息资源检索技术
1.3.1 传统的信息资源检索技术
1.3.2 新型的网络资源检索技术
1.4 信息资源检索的方法、途径和步骤
1.4.1 信息资源检索方法
1.4.2 信息资源检索途径
1.4.3 计算机信息检索策略的制定与实施
1.5 信息资源检索效果的评价
1.5.1 信息检索效果的评价
1.5.2 信息检索的意义
习题
<< 查看详细目录
【书摘】
第1章 信息资源检索基础知识
1.1 信息资源检索概述
1.1.1 信息资源
3.文献信息源的类型
1)按照信息源的加_丁程度划分
文献信息源的分类方法多种多样,其中,按照加工的程度来划分,文献信息源可以分为:
(1)零次文献。零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。零次文献与一次文献的重大区别就是前者没有形成正式文献,没有正式发表。零次文献的主要特点是内容新颖,具有原始性,但不成熟、分散,难以获得和检索。
(2)一次文献(primary 1iterature)。一次文献义称为原始文献,是人们研究或创造性活动成果的直接记录,一般指公开出版的著作、期刊论文、科技报告、会议文献、学位论文、发明专利等。一次文献记载的信息零碎、分散、无序,同时它也具有新颖性、创造性和系统性等特征,参考和使用的价值较高。
(3)二次文献(secondary literature)。二次文献是指通过科学的方法,将分散无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,编制而成的有系统的文献。它包括目录、文摘、索引等,它们是二次文献的核心。
二次文献的形成是从分散、无序到集中、有序化的书目控制过程,这种文献具有浓缩性、汇集性、有序性等特点。二次文献易于存储、检索、传递和使用,有较高的使用价值。
(4)三次文献(tertiary literature)。三次文献是系统地组织、综合研究和分析一次和二次文献的结果,是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,如述评、网络全书、专题报告、年鉴、手册、字典等。三次文献具有资料性和实用性,是对一次文献进行浓缩、提炼、重新组织,内容有较大变化。
零次文献信息源是最原始的信息资源,虽未公开交流,但它是生成一次文献信息的主要素材;一次文献信息源是最主要的信息资源,是人们检索和利用的主要对象;二次文献信息源是对一次文献信息的集中提炼和有序化,是检索一次文献信息的丁具,故又称检索工具;三次文献信息源是按知识门类或专题将一次文献信息重新组织、高度浓缩而成,是人们查考数据信息和事实信息的主要信息源。
……
【相关资源】
· 程序员的7种武器(正则表达式、编程语言、数据库、算法、软件调试、开发环境)
· 【推荐嵌入式学院相关就业培训课程】(嵌入式Linux、Symbian手机开发、WinCE/Mobile开发、FPGA等)
网络信息检索与利用 -所有相关信息
Ⅱ 网络信息检索的基本策略是什么
基于网络环境的信息检索策略从计算机网络信息检索的基本工作原理中我们可以容易看出,信息需求用户输入的检索提问表达式必须和索引数据库系统的记录信息特征标识相匹配才能准确检索到需要的信息。
网络信息检索策略设计应遵循快、准、全及低成本的原则,以实现检索策略最优化。
1、明确检索目标,确定检索项
分析主题、使用布尔逻辑算符等构造检索式
2、选择合适的检索系统
根据检索主题和检索系统的特点选择检索系统
3、正确对待检索结果
对漏检、错检、溢检、无检索结果的处理方式。
4、选择最佳上网时间
选择网速较快的时间段。
多数情况下,有一个好的搜索策略,能正确地应用布尔逻辑符,并熟悉每个搜索引擎的特性,就可得到一个好的检索结果。除此之外,在某些情况下还可用其他的一些技巧来改善检索结果。
1、扩大检索范围、提高查全率
2、缩小检索范围、提高查准率
3、Ctrl十F
用搜索引擎检索到所需文档并连接到相关网页后,有时会发现所要的文件并没有出现在当前视野中,这可能是因为文件存放在当前网页的底部。一个快捷的方法就是按“Ctrl十F”在当前页查找文件。
4、给检索结果作标签
避免再重复出现。
Ⅲ 网络信息检索与利用的介绍
《网络信息检索与利用》是朱红编著的图书,全面介绍了网络信息资源的检索方法及其利用,共分为基础篇、综合篇、技巧篇、服务篇和实训篇5个部分。《网络信息检索与利用》可以作为高等院校理工科专业、经济管理类专业的本专科生及研究生的信息检索课程的教材,还可以作为科研人员的信息检索参考书。
Ⅳ 网络信息检索与联机信息检索最根本的不同是什么
联机信息检索:用户借助通讯线路,通过终端设备同检索系统联机所进行的文献与数据检索。这种计算机系统一般设有较多的数据库,而每个数据库可以包括几百万条文献的书目款目或科技数据。每检索一个课题只需数十秒钟,检索到的题录、文摘或数据还可立即在终端上显示和打印出来。联机检索的实现,对于图书馆传统的收集、查找与提供资料的方式来说,是一次革命。
网络信息检索:指因特网检索,是通过网络接口软件,用户可以在一终端查询各地上网的信息资源。这一类检索系统都是基于互联网的分布式特点开发和应用的,即:数据分布式存储、用户分布式检索、数据分布式处理。
二者的不同点在于:
联机检索通过检索软件的运行从联机信息中心数据库查寻信息,检索方法是通过终端设备输入检索词或检索策略进行检索,而网络检索从远程机中获取信息,网络信息检索系统的检索工具是搜索引擎;
联机检索需要通过使用终端设备,按照一定的检索规则进行检索,而网络检索为用户提供了良好的信息查询界面:
联机信息检索的检索费用较高,而网络信息检索大多时候是不需要收费的:
联机信息检索的信息质量好,而网络信息检索的信息存在着大量的垃圾信息,信息质量较低;
联机信息检索查准率高,而网络信息检索查准率低。
Ⅳ 数据挖掘与信息检索,网络安全发展及就业前景
网络前景不大,就那些东西。
信息检索与数据挖掘不错。都是数据库层面,数据挖掘,分析,前景不错
至于你们老师给推荐工作,这个建议你别放在心上,别想太多。没用
还有大学本科学习的东西,比如组成原理,网络基础、算法、加密解密、数据结构,C语言,汇编,电路、操作系统这些东西,你一定要学,虽然目前你感觉没啥用,但是我告诉你,如果你学的非常棒,那么毕业之后,你想转IT的任何一个分支都轻松加愉快,而且进步速度非常快
不要相信大学无用论,大学本科和专科一个最大的区别,就是本科一直在学看上去好像过时的东西,而且对就业没有作用,专科学技术,上来就能干活的。但是我告诉你,专科想转别的分支或者提供自己非常难,但本科不一样。。
其实你看看社会招聘,你就能感觉出来,小公司都是问你具体技术问题,比如怎么写一个jsp网页等。但是想微软、网络、这些大公司,不会问你怎么写jsp,他们只问你,怎么实现数据结构,操作系统原理。算法一类的问题。
所以大学要学好这些基础。你说的那些数据库啊,什么的,都是应用层面的东西,跟word,excel一样,
Ⅵ 什么是网络信息检索
主要指对利用Internet信息发布技术,通过Internet发布的信息进行的检索,主要利用搜索引擎、网络机器人和门户站点等来完成。
因特网上有海量的数据,是信息的海洋,但在解决实际问题中,仍感到缺乏真正需要的信息,出现了数据丰富,信息贫乏的问题。如何在海量数据堆中,准确、快速的找到所需要的信息,是一个需要很好解决的重大问题。因此,网上信息检索技术,为用户从包含各种数据的文件堆中查找所需要的信息或知识的技术,便成为因特网应用中的一个关键性问题。
作为信息海洋的因特网,从浏览器上通过逐个网页浏览寻找所要信息的方法,就像大海捞针一样,不仅浪费大量的计算机时间和占用网络通道资源,也很难找到真正需要的信息,利用信息检索技术及为其开发的软件系统才是唯一可行的方法。
信息检索技术是将因特网上的海量数据,通过软件系统的检索查询,根据用户提供的需求,把用户所要的信息提取出来,经十多年发展已经取得了不少突破性的进展,发展了一大批有效、不同的信息检索软件,如文本信息检索、动态网页Web信息检索、检索引擎等一些重要的检索方法和技术,特别是检索引擎,成了Web上查找信息不可缺少的工具。
特点
由于网络信息检索借助网络通信、信息处理等技术的发展,与传统信息检索相比,网络信息检索具有如下特点:
1.检索范围、领域涵盖广。网络信息检索的信息来源范围通常涵盖全球,而信息资源类型、学科(主题)领域也几乎无限制。
2.传统检索技术与网络检索技术相结合。传统的信息检索核心检索技术如布尔逻辑检索、截词检索、限定检索等检索技术在网络信息检索中被沿用。但是网络信息检索技术借助网络信息技术的发展,一些新的检索技术也融入到网络信息检索中,如人工智能、数据挖掘、自然语言处理、多媒体检索技术、多语言检索技术等,如一些搜索引擎能将搜索结果进行自动分类。
3.用户界面友好,容易上手。网络信息检索所借助的网络信息检索工具均以面对非专业信息检索的广大网民为主,通过各种交换和智能技术,使得一般检索基本能解决大部分问题。不需要专门的检索技术和知识。不过,高级搜索就相对难一些。
4.信息检索效率低。由于网络信息资源浩如烟海,信息资源良莠不齐等特点,信息检索结果数量虽多,但是查准率较低,尽管一些新的技术如数据挖掘技术、自然语言理解技术等的不但发展和应用,但网络信息检索效率低的状况短时间内还无法改观。
Ⅶ 结合自己的使用经验,谈谈网络信息检索的优势与不足,以及对改进网络信息检索效率有何自己的见解。
1。基于网页的网络信息检索工具的现状和发展趋势 1。1现状。网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。
一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。
网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。
但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。
(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息
Ⅷ 网络信息检索的方法有哪些分析这些方法的差异性及其各自的优势
网络信息检索方法主要有以下四种:1、漫游法2、直接查找法3、搜索引擎法4、网络资源指南法1.漫游法
(1)偶然发现。这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。
(2)顺“链”而行。指用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的“追溯检索”,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。
2.直接查找法
直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。
3.搜索引穆检索法
此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。 4.网络资源指南检索法
此方法是利用网络资源指南进行查找相关信息的方法。
网络资源指南类似于传统的文献检索工具————书目之书目(bibliography of bibliographies),或专题书目,国外有人称之为web of webs,webliographies,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。参考资料:过仕明主编. 信息检索概论. 黑龙江科学技术出版社, 2005.10
Ⅸ 网络信息检索及其发展趋势是什么
一、智能化
智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预,这意味着用户将彻底从繁琐的规则中解脱出来。近几年来,智能信息检索(intelligent information retrieval)作为人工智能(AI)的一个独立研究分支得到了迅速发展。在Internet技术迅速普及的今天,面向Internet的信息获取与精化技术已成为当代计算机科学与技术领域中迫切需要研究的课题,将人工智能技术应用于这一领域是人工智能走向应用的一种新的契机与突破口。
二、可视化
可视化(visualization)的历史可以追溯到2400多年前。哲学家柏拉图指出,我们通过看来识别物体。据统计,人获取信息有70%一80%靠视觉,20%靠听觉,10%靠触觉。用图像(visual)取代文字帮助人们检索的优点在于:图像的表达方式生动、形象、准确、效率更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。
三、简单化
未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的用户友好性将不断增强,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任一应用程序都能“连接”进行“网络检索”,并与网络“交互”;各搜索引擎检索界面更加“傻瓜化”。使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完善,会越来越方便用户及时准确地检索信息。这些硬件与软件技术的发展都有利于网络信息检索的简单化。
四、多样化
多样化首先表现在可以检索的信息形态多样化,如文本、声音、图像、动画。目前网络信息检索的主体是文本信息,基于内容的检索技术和语音识别技术的发展,将使多媒体信息的检索变得逐渐普遍。
多样化的第二个表现是检索工具向多国化、多语种化方向发展。网络的迅速发展,使得整个世界变成了地球村,世界各地上网人数的不断增多,使得英语已无法满足所有用户的需要,语言障碍越来越明显。
多样化的第三个表现是网上检索工具的服务多元化。网上检索工具已不仅仅是单纯的检索工具,正在向其他服务范畴扩展,提供站点评论、天气预报、新闻报道、股票点评、各种黄页(如电话号码)、航班和列车时刻表、地图等多种面向大众的信息服务、免费电子信箱,以多种形式满足用户的需要。无论是在国际上还是在国内,检索工具都在朝多元化方向发展,为用户提供全方位服务。
多样化还表现在网络信息检索可以间接地服务于其他行业。例如数据挖掘技
术可用于分析历史数据的变化趋势,预测未来发展方向,发现大量数据中潜在的模式规律,为投资、科研、项目评估等提供有力的依据;还可以系统地、定量地分析目前较为热门的研究发展领域及查询频繁更新的文献资料种类,可使信息中心、图书馆等信息服务机构不断调整文献资料及图书的订阅、收集工作,有的放矢,向以需求为驱动的方向发展,建立一套更为系统、科学的管理方式。
五、个性化
个性化指各网站注重内容的特色化和注重个性化的服务。
网络资源的指数级膨胀,使得用户在获得自己需要的信息资源时要花费大量的时间和精力。随着互联网的飞速发展,每个人的不同信息需求将凸现于标准化、单一的“大众需求”之上,并成为各个搜朋够或网站努力追求的对象。不同的打有消费者个人烙印的产品将成为某个消费者区别他人、感觉自我存在及独特的外在标志,个性化服务成功的实质在于提供了真正适应用户需要的产品,贯彻了以用户为中心的理念。
六、商业化
网络检索系统拥有全世界数量众多的用户,吸引了大量的广告,为电子信息的增值服务提供了广阔的空间。网络检索系统已成为新的投资热点。网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公用性转向商业化。美国著名的数字媒体评估公司Jupiter Media Metrix日前发布研究报告称,“搜索引擎公司推出的付费添加服务是一个正在兴起的、前景光明的因特网领域,相对于目前低迷的在线广告市场来说,它的发展潜力是非常巨大的。”