优胜从选择开始,我们是您省心的选择!—— 无忧期刊网
帮助中心
期刊发表
您的位置: 主页 > 论文范文 > 电子论文 > 正文

试论文献检索的计算机信息管理检索语言及方法

作者: 来源: 日期:2014-09-25 22:31人气:

吕 珂
【摘 要】本文计算机信息管理论文主要阐述根据文献检索创制的人工语言的分类,简单论述了检索语言的优点和局限性及其正确的使用方法。
【关键词】文献检索 语言 标识

检索语言是根据文献检索需要创制的一种人工语言,又称检索标识。如果从反映文献特征的角度来看,那些代表了文献外表特征的著者姓名、题名、报告号、标准号、专利号、档号等检索标识和代表了文献内容特征的类号、叙词、标题词和关键词都是检索语言。但从检索标识规范化的角度来看,检索语言可分为自然语言检索标识和规范语言检索标识。
一 体系分类法和分类检索语言
体系分类法是一种直接体现知识分类的等级制概念标识系统。它是对概括文献情报内容及某些外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成的。体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献情报的途径。
所谓“类”,是指具有共同属性的事物的集合。一类事物除了具有共同属性外,还有许多不同的属性,可进行多次划分。一个概念经过一次划分后形成的一系列知识概念就是种概念,又称子位或下位类,被划分的类称为母类或上位类,也即属概念;由同一上位类划分出的各个下位类互称为同位类,也即并列概念。一个概念每划分一次,就产生许多类目,逐级划分,就产生许多不同等级的类目,这些类目层层隶属,就形成了一个严格有序的知识门类体系。用规范化的人工符号——字母、数字和语词表示这些类目,就构成分类表,类号和类名就是分类检索语言。从分类角度查阅文献,应使用体系分类表。例如,查阅特色皮鞋市场的文章,至少要进行经济→贸易经济→商品学→轻工业产品这样四次概念划分,才有可能找到有关的类目(图1)。
 


体系分类法具有按学科或专业集中、系统地向人们揭示文献资料内容的功能,这对于希望系统掌握和利用某一专业范围的文献而言,无疑是有效的。目前在我国通用的主要分类法是《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。“中图法”是国家推荐统一使用的分类法,被许多检索工具采用或改编,分5大部类22大类,类号采用汉语拼音字母与阿拉伯数字的混合号码,用一个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本上遵从层累制的原则。

二 主题法和主题检索语言
主题法最常用的有叙词法(descriptor)和标题法(subject heading)。前者采用表示单元概念的规范化语词的组配来对文献内容进行描述,是一种后组式词汇标识系统;后者使用一个或者一组规范化的自然语言作为检索标识来描述文献的内容,是一种先组式的词汇标识系统。它们的优点是:在表达主题内容方面具有较大的灵活性,抛弃了人为的号码系统,代之以通用的规范语言,并在各主题之间建立有机的参照系统,代替了等级制的直线排列。它使用组配和索引等方式,较好地满足多元检索的要求。
用主题法查找文献,要注意以下几点:
(一)注意利用词表
可供参照的词表有《汉语主题词表》、《中国档案主题词表》、《中国分类主题词表》、《社会科学检索词表》、《国会主题词表》(Library of Congress Subject Headings)等,或系统本身建立的词表。选用恰当的主题词表达提问分析结果所形成的概念。主题词是检索系统使用的专门的规范化语言,用这种语言表述的概念,只有一种解释,不允许一词多义,多词一义,这是规范化检索语言的单义性所规定的。而一般用户的提问用的是自然语言,自然语言并不遵守特定事物具有特定概念用特定语言表达这一原则。“用户”这一概念从不同的角度会有不同的表达,如主顾(patron)、顾客(customer, client)、购物者(shopper)、消费者(consumer)、使用者(user)、读者(reader)等。检索者先要了解查阅的检索工具是采用哪种词表组织款目的,然后在该词表中选用恰当的检索词来代替原先拟使用的不规范词语。
(二)选择主题词要把握概念的含义
选词时不要仅从字面上“对号入座”,否则,不是找不到主题词就是用错了意义相近的词。如查“多元共渗”方面的英文资料,汉英词典没有字面上对应的词。这时抓住概念分析这一武器,就可以知道这是指多种元素在一定温度、压力、浓度条件下自金属表面扩散的能力有所提高,利用的是扩散涂层原理,因此通过Diffusion Coating就可以找到有关文献,如果在词表中“对号入座”就无从下手,甚至会导致检索时张冠李戴。
(三) 要利用概念之间的属种关系和相关关系增加检索线索。
属种关系又称上下位关系,指一个概念的外延被另一个概念的外延所包括,包括概念是属概念,也即上位概念,被包括的概念是种概念,即下位概念。列出大量具有属种关系概念的词语就可以利用属概念扩大检索途径,或利用种概念缩小查找范围,提高获得文献的准确性。相关关系指属种关系以外的具有交叉、并列、对立关系的概念,以及形式与内容、本质与现象、原因与结果等关系。在词表中,用“参见”(see also)、“参见自”(see also from)或其它标识符号来表示这些关系。善于利用这些关系,有利于提高查全率。
综上论文,充分认识上述各种检索语言的长处和局限性,就可以在使用中扬长避短,对提高查准率和查全率都是大有益处的。

参考文献:
⑴隋淑萍, 张晓红, 王晶. 手工检索在查新咨询工作中的地位与作用不容忽视. 现代情报, 1997(2):15
⑵孙丽, 陈通宝,乔晓东. 网上中文检索工具的比较研究. 情报学报, v18 1999(3):225-234
⑶张琪玉. 情报检索语言. 武汉大学出版社, 1985. 第23页


 

在线客服:

无忧期刊网 版权所有   

【免责声明】:所提供的信息资源如有侵权、违规,请及时告知。

专业发表机构