学历改变命运
24小时客服:4008135555/010-82335555
当前位置:首页> 经济学 > 自考《档案文献检索》串讲资料(1)

自考《档案文献检索》串讲资料(1)

2007年01月11日    来源:   字体:   打印
成绩查询

  第一章 档案文献检索系统概述

  1. 广义的档案文献检索包括存储和查找两个具体过程。前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。

  2. 简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。匹配的实现是存储和查找互相作用的结果。

  3. 存储阶段的目的是:使档案信息达到高度的组织化。主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。

  4. 查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。(3、4题可合并一题)

  5. 档案文献检索同其他文献检索一样,可以采取三种形式:

  (1)数据检索。这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。

  (2)事实检索。这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。

  (3)文献检索。这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。

  6. 试述档案文献检索系统的构成与功能?

  档案文献检索系统是一个由若干因素、若干工作环节构成的动态系统,这些因素或环节互相影响、互相制约。从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。档案文献检索系统包括两大部分:存储部分和检索部分。存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。

  在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。

  在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。

  7. 档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。

  8. 文献单元方式:在计算机检索中又称为顺检方式、顺序文档。它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。

  9. 标识单元方式:在计算机检索中又称为逆检方式、倒排文档。它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。

  10. 检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个更基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。

  11. 查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。

  12. 查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。

  13. 简答查全率和查准率的关系:查全率和查准率之间存在着互逆关系的结论。也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。

  14. 论述影响检索效率的因素:

  (1)检索语言的功能。检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定的需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。

  (2)检索途径的数量。从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。

  (3)著录标引的质量。检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。

  (4)检索策略的优劣。 如果说,档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。

  (5)检索人员的素质。不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。

  15.简档案文献检索系统评价的目的和作用:系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。作用主要有三个方面:(1)明确系统当前的性能特征,从而科学地、更大限度地发挥系统的功能。(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。(3)为设计和建立新的档案文献检索系统提供参考。

  16.试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。

  (1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。

  (2)查全率和查准率。二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的更重要的指标。需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:①对文献相关性的判断不可避免地带有主观性和模糊性。②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。

  (3)响应时间。它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。

  (4)可存取性。是指一个档案文献检索系统的易用程度。

  (5)费用。构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。

  17.简系统评价步骤:(1)制订评价方案。包括确定对该系统进行评价时采用哪些评价指标。

  (2)评价对象调查。可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。(3)测试。根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。(4)数据处理与分析。对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。(5)对评价结果进行分析,提出改进意见。

新人有礼
关闭