为了更有效地收集、整理、传播最新科技知识提高文献资料的使用效率,使得科学情报工作适应科学技术的高速度发展,人们加强了情报科学的研究。现代情报科学的研究动态有以下几点值得重视:

1)加强了情报职能工作,建立了情报职能中心。近年来,许多发达国家极力强化国家科技情报体制,建立全国统一的情报中心。例如,苏联继1952年建立了“全苏科技情报所”之后,在国家科委内又成立了“科学技术情报宣传局”,集中管理全国情报工作。美国也成立了“联邦科学情报局”,管理美国的科技情报职能工作。(2)科学情报事业机构的多样化和专业化。目前,除了图书馆及进行科技文献资料管理、情报研究和情报服务的综合性情报中心之外,还出现了专利情报中心、科技文献翻译中心、全国统一编目中心、数据中心及正在进行中的科研项目的情报中心等。例如,专利文献对科研、生产有着直接的参考价值,苏联1962年建立了拥有2500人的全苏专利情报研究所,专门收集、管理、研究专利文献,并提供服务;法国科研中心的文献中心开展了译文登记和代译服务工作;美国国会图书馆最早开展了书刊统一编目工作,使得国家便于掌握和协调收订工作,减少各有关单位的编目工作量并便于读者查询。(3)科学情报机构的国际化。在现代科学技术高度发展和广泛利用的今天,在国家之间建立互通情报的合作关系,已成为一种趋势。联合国科教文组织的“综合性情报计划”是该组织的四大国际计划之一,其目的是促进世界各国情报、图书、档案工作的发展与合作,并在自愿的基础上逐步建立世界性的情报网。此外,由15个国家建立的“世界数据工作咨询中心”,总部设在法国,可免费为参加国提供服务;法国格勒诺贝尔城的“热数据中心”是与欧洲一些国家及美苏合作建立起来的,该中心已存贮了12,000篇文献,2000多种金属及化合物的热数据;欧洲经济共同体于1975年作出决议,建立“欧洲经济共同体联机情报网”,供西欧九国使用。(4)科学情报手段的现代化。电子计算机、通讯技术以及数据库技术的发展,为情报工作的现代化提供了新的手段,开辟了新的途径。使得文献情报资料的管理和检索实现了自动化,情报的利用和传递实现了网络化。电子计算机应用于情报检索工作是情报管理方式、服务方式和服务质量的一个飞跃,下面将着重介绍一下计算机情报检索系统的构成原理及国内外发展动向。

所谓计算机情报检索系统,就是利用电子计算机,根据某种目的从经过整理并已存贮人计算机内的情报资料中获得必要而且充分的情报的系统。它包括把文献资料加工编辑为资料档的存贮技术和根据人的需要从资料档中查找出所需文献资料的检索技术。一个计算机情报检索系统的构成及处理流程一般包括以下几部分内容。

1)文献情报的收集、分析和加工。由于科技文献的信息量十分庞大,如果情报检索系统按其原型存贮和检索不仅会占用大量的存贮空间,而且检索时间也会很长。因此,需将原情报资料进行分析、加工和整理,确定文献资料的著录项(如标题、卷、期、页数、出版年月、所载刊物名称、作者名、索取号等)、主题词,并将文献的重要部分编写为文摘。以上工作一般是由人工完成的。

2)文献资料的输入。经过整理的文献资料用数据形式表示之后,可按联机方式或脱机方式输入计算机。所谓联机方式,就是使用数据通讯线路将数据直接输入计算机。所谓脱机方式,就是将数据先转录到某一中间载体,然后再用输入设备将中间载体上的数据送入计算机。由于不论是在终端键盘上联机输入还是预先在纸带、卡片上穿孔后再脱机输入都要花费繁重的劳动,所以人们正在寻求简便的输入方法。例如,可以用光学字符识别(OCR)装置或者磁性墨水文字识别(MICR)装置将文献数据直接输入计算机。但在技术上还有许多难点有待进一步解决。

3)资料档的建立。文献资料在计算机内的存贮,必须预先设计好它们的存贮结构。一般可采用线型结构、树型结构或网型结构等。资料档也可以采用顺排资料档或倒排资料档两种方式。所谓顺排资料档,就是每文献的记录中包括作为查找依据的索引项目(如主题词或文献号等)和用于输出的详细信息;所谓倒排资料档,就是以索引项目为依据,把包括同一索引项目的不同文献记录号集中起来,构成索引项目与文献记录号之间的一多对应关系,而文献记录则按照索引项目的某种次序排列。系统中的资料编辑程序将按照预先设计好的存贮结构,对输入计算机内存贮器中的文献数据进行编辑、转换,并在内存贮器或磁带、磁盘等外存贮器上建立相应的索引文件及文献记录文件,供检索程序使用。由于建立资料档也要花费大量的人力和物力,每一单位独立完成资料档成本很高。所以,最近出现了商品化的市售资料档。例如,国际上比较有名的商品化磁带有:《MARC-》(美国国会图书馆机器可读目录),《USGRA(美国政府研究报告),《DERWENT》(特温世界专利报告),《COMPENDEX(美国工程索引)等。商品化的资料档比自己加工输入的费用便宜得多而且使用效果好,所以得到了广泛的使用。另外,为了高效率地建立文献资料档,近年来还普遍采用了数据库管理系统(DBMS),使得文献资料能以最合理的方式存贮且保持与程序之间的独立性,以便为一个或多个应用项目服务。

4)文献资料的检索。计算机情报检索系统可对用户提供多种方式的服务。① 定题、定期检索:即对于用户提出的确定的课题与要求,系统定期对新到文献资料进行检索,并将检索结果及时提交给用户。② 追溯检索:对于用户提出的要求,系统对过去积累的资料档进行专题追溯检索,并将检索结果提交给用户。③ 联机情报检索:用户利用计算机的终端设备与计算机进行对话,并向系统进行提问,系统立即给出结果。检索功能的实现是由提问解释程序以及检索程序完成的。对于检索的实时性要求不高或者进行批处理时,采用顺排资料档的检索效率较高而且比较经济。如果用户要求实时性较强或者提问涉及的文献资料档范围较广时,则要采用倒排资料档的检索方法。

5)文献资料的输出。对于每个提问,每当检索出答案后便由输出程序进行转换并按一定格式进行输出。由于情报检索的输出量都比较大,特别是如果每篇文献都包括文摘及其他详细情报或者进行批处理的情况更是如此,因此要求系统具有较强的输出功能。目前广泛使用的输出手段主要是屏幕显示及行式打印机。此外,也可以使用照相排版或计算机缩微输出的方式。据估计,一台缩微输出设备的效率可相当于30台行式打印机或5000台电传打字机。目前国际上流行的缩微胶片每张最多可容纳80页文献。

计算机情报检索系统诞生的历史虽然不长,却已经历了三个发展阶段:脱机情报检索阶段(1954 ~ 1964年),联机情报检索初期阶段(1965 ~ 1972年),联机情报检索普及使用阶段(1973年以后)。现在,世界上较大型的联机情报检索系统已有100余个。例如,美国国立医学图书馆1964年建立的医学文献分析与检索系统(MEDLARS),已于七十年代初起全面改建为联机检索系统,并改称为MEDLENE系统,使用一年后其利用频率提高了十倍以上。目前,该系统已扩展到法国、西德、加拿大、澳大利亚、瑞士、日本等国,成为一个国际性的医学情报中心。日本的科技情报服务系统开始于1969年,七十年代初也开始着手研究联机检索服务。1976年,日本科学技术资料中心(JICST)建成了JOIS系统,开展了联机情报检索服务。目前,除了JICST本部之外,配有汉字处理的联机服务已经遍布东京、大阪、筑波、名古屋、广岛及九州等全国各地。用户可以使用分布在各地各机构中的终端机随时查询系统中的四大文献。其中有① JICST理工学文献档。它存贮了能源、生命科学、环境污染、管理系统技术等方面的8,500余种杂志、技术报告、会议资料、论文等。CAC化学文献档。它存贮了有机化学、生物化学、高分子化学、应用化学、化学工程、物理化学、分析化学等领域共125个国家出版的杂志、专利文献、会议资料、学位论文等共约14,000余种。③ MEDLARS医学文献档。它存贮了有关临床医学、齿学、兽医学、环境卫生医学、医疗工程、护理学、生物学、生物化学、药学等方面2,300余种杂志和专题论著。T0 XLINE毒素文献档。该文献档是NLM(美国国立医学图书馆)将CAC及BIOSIS等机构所编制的资料,经过再编辑之后而提供的。它收集了125个国家14,000种刊物中有关毒素学方面的文献资料,并包括26个国家的专利及全世界主要会议资料、学位论文等。目前,该文献档已存贮了50万件资料,可为用户提供化合物的毒性、安全性以及对生物体的作用和影响等方面的查询服务,这对于化学工业、食品加工、医药品、农林水产等方面的研究起着十分重要的作用。在日本,除了JICST所建立的JOIS系统之外,许多大学及研究单位也普遍采用了联机检索服务系统。例如,国立东京大学的TOOL-IR系统、国立广岛大学的hundred系统、国立名古屋大学的NKWIC系统、国立筑波大学学术情报中心的IDEAS系统、国立东北大学的UNIQ-1系统、日本经济新闻社的NEEDS-IR系统以及日本农林省的RECRAS系统等。

苏联的列宁图书馆是该国最大的国立图书馆。按照1966年1月19日苏联部长会议的要求,该馆于W68年制定了一个大规模的自动化计划,对于文献存贮和情报检索这两项工作分别建成“出版 - 入藏 - 情报”系统和“读者 - 入藏 - 图书”系统。开始的三年(1968-1970年)着重对于优先开发的项目和程序进行选定和系统分析:1971 ~ 1975年对各系统进行技术准备和实验性操作;1975 ~ 1980年完成自动化程序的第一阶段计划;整个系统将于1990年全部实现。目前已完成了读者借阅服务系统、对读者借阅和拒绝的统计分析系统、采访登记系统、图书馆文献的情报传播和检索系统以及图书的馆际交流系统等。如果列宁图书馆的自动化系统的设想得以实现,它将可跻身于世界上这类最大系统的行列之中。但是,目前的进度大都落后于计划,因此可能会对计划中提出的某些工作加以简化。

由上可见,计算机情报检索系统需要存贮大量的信息、需要能够快速地进行检索并能实时地处理用户的联机查询。因此,对于计算机硬件和软件都有较高的要求。目前的系统一般均采用运算速度快、存贮容量大、输入/输出设备,多样、操作系统及数据库管理系统功能齐全的大型计算机。许多系统为了满足联机检索的需要采用或更换了新型的机种。例如,前述的JOIS系统便使用了日立公司制造的M-170大型计算机,其主存容量为2 MB。苏联的列宁图书馆最早使用一台第二代的中型计算机(明斯克-22)运算速度仅为每秒6,000—8,000次。W72年改用一台较为先进的ASVT-M2000型第三代的计算机。1980年以后将使用四台ASVT-M4030大型计算机。以上这种趋势,对于建立大型的联机检索系统无疑是必要的,但却不利于计机在中小型图书馆中的普及。目前,随着大规模集成电路工艺的进展,微型计算机在运算速度、存贮容量、可靠性程度以及性能价格比等方面都有了大幅度的提高,所以人们正怀着极大的兴趣在探索微型计算机应用于图书馆管理和情报检索中某些领域的可能性。例如,可以把微型计算机作为联机检索系统的智能终端,对于用户的键盘输入及情报资料的输出可以进行预处理,从而减少使用联机系统和通讯线路的费用,提高检索效率。在英国,使用Lockheed Dialog或SDG Orbit等国际联机系统的费用为每分钟约一英镑。如果利用智能终端,则可使费用降低30%以上。现在,英国的曼彻斯特大学理工学院(UMIST)正在研究具体的实现方法,并确定这些系统的实用前景及其经济价值。此外,还可以在对微型计算机进行充分的系统功能分析的基础上开发各种小型的应用系统。例如,外借检查系统、短期借阅系统、长期借阅系统、图书编目系统、新书订购处理系统等。微型计算机应用于情报检索工作的前景是十分广阔的并已取得了许多成果。美国情报科学学会得克萨斯州分会于1979年召开了年会,会上集中讨论了微型计算机在情报处理中的应用状况和今后进一步研究的计划。

在我国,最近也有许多图书馆、大学和科研单位对于计算机情报检索系统进行了研究和尝试,并已取得了许多可喜的成果。例如,北京图书馆的计算机检索系统已有相当规模,并可正式向用户提供服;清华大学图书馆建立了一个小型计算机实验室,利用国产的DJS-130小型机对于书目检索、流通管理及图书馆事务管理等方面进行了试验;上海交大研究试制了STJU检索系统,现在已将5,000多篇馆藏文献的有关信息存入计算机系统,并可向读者提供服务;上海同济大学在微型机上开展了期刊存贮与检索的实验;上海机械学院利用DJS-130机建立了部分图书的流通管理系统,具有借书、还书、预约、续借、查询等功能,并已向教职工提供服务;为了进一步探讨微型计算机在图书馆工作中的应用领域,上海铁道学院在Z-80微型机上研制了英文原版图书计算机检索和管理系统EPBCRMS),该系统存贮了馆藏的400余本英文原版图书的题录信息,读者可以人机对话的方式用主题词或ISBN码进行检索。此外,为了充分利用存贮的有关信息,提高图书馆管理工作的自动化水平,系统还提供了打印新书目录、按字典序打印主题词表以及打印常用统计报表等功能。