手机版
您的当前位置: 钻爱网 > 方案 > 管理方案 > 关于专业化小型化数据库建设的思考以柳宗元数据库建设为例|柳宗元

关于专业化小型化数据库建设的思考以柳宗元数据库建设为例|柳宗元

来源:管理方案 时间:2019-10-30 07:55:59 点击:

关于专业化小型化数据库建设的思考以柳宗元数据库建设为例

关于专业化小型化数据库建设的思考以柳宗元数据库建设 为例 胡娟 肖献军 摘要:随着学者研究的不断深入,大型化数据库越来越 满足不了研究者的需要,专业化数据库的建设迫在眉睫。学 者要积极参与到专业化数据库建设中来,在专业化数据库建 设中起关键性作用;
数据库技术开发者要努力设计出智能化 更高的数据库,国家、地方也应在专业化数据库的建设上给 予更多的政策层面和经济层面上的支持。

近年来,各类大型化古典文献数据库越来越多,如《中 国基本古籍库》《国学宝典》《汉籍全文检索系统》《中国 方志》等,港澳台及国外也有不少,如《瀚典全文检索系统》 (台湾)《汉达古籍资料库》(香港)《全国汉籍——日本 所藏中文古籍数据库》(日本)等。古典文献的数据化极大 提高了研究者的效率,也使得研究结果更准确化、科学化。

然而,随着数据库资料的越来越庞大,学者在享受其提 供的方便时,也带来了不少烦恼。主要是学者对相关资料的 分析与辨伪越来越困难,在一些特大型的数据库中,输入某 个人名或者书名,显示的可能是几千条甚至几万条检索信息。

面对如此多的检索信息,对于那些文献基础较弱的学者而言, 有这些文献资料还不如没有这些文献资料得好。确实,成千 上万条的文献资料,究竟有多少条能为学者利用,有多少条 价值确实比较高,真的很难分辨出来。于是学者陷入了浩瀚的文献资料中而难以解脱出来,原本可以提高研究效率的数 据库反而影响了学者的研究效率,这一点可能是那些大型数 据库开发者始料未及的。要摆脱这种困扰,数据库建设者需 要改变传统观念,一方面要继续开发一些大型的数据库,另 一方面需要开发一些专业化较强的小型数据库。后一类型的 数据库,对于学者的研究无疑更具有现实价值和实际意义。

但专业化数据库的建设不是件容易的事。与大型数据库 相比,这种类型数据库的建设者不仅仅只是技术的掌握者, 还必须是某领域、某方向上的专家。然而,二者兼有的人才 少之又少。这就需要有协作和分工。“人类如何适应并利用 其独特的思维方式,将人的创造性思维与计算机的强大功能 有机结合起来,把古典文献研究提升到一个更高境界,是广 大文学研究者和IT业者共同面对的挑战。”[1]一方面,需 要相关技术公司提供新的技术,另一方面,需要相关高校、 研究所投入一定的人力、物力、财力,搜集整理建库所需要 的资料。这样就把先进的技术和专业的知识结合起来,就能 建设出高水平、高效率的专业化数据库。

如要建设一个与柳宗元相关的数据库,虽然大型数据库 中会有一些相关的柳宗元的资料,但相对起来比较零碎,而 且还不全面。如果把搜集资料的任务交给某些学者,建立起 来的数据库可能会完全不同。就以我所在的湖南科技学院而 言,我校翟满桂教授就是柳宗元研究方面的专家,在柳宗元 方面先后立项了一个国家课题、一个教育部课题、一个省级重点课题。她指出,就版本而言,宋代刊刻柳集有九个不同 版本,明代有三种,清代有三种,现当代则多达十多种;
柳 宗元年谱今存十二种。这些资料的掌握和搜集,不是那些大 型数据库的建设者所能做到的,只有专家学者才能做到。如 果再联合尹占华、尚永亮等人的研究成果,建立起来的数据 库一定是资料最全面、最具权威性而又最专业的柳宗元数据 库了。

专家学者除了可以在资料的搜集上起重大作用外,还能 够对资料进行整理和归类。今天一些大型的古典文献数据库, 资料的分类大多是依据四部进行的,有些数据库虽然在分类 上有所改变,但实际上只是细节上的改变。如果建立专业化、 小型化的数据库,四部的分类无疑适应不了研究的需要。柳 宗元资料搜集起来后,怎样对这些数据进行分类,也不是数 据库技术开发者所能解决的。资料的分类必须以怎样方便研 究者研究为目的。如要建设柳宗元数据库,再按经史子集的 标准去分类,就完全不符合实际了。如果从学者使用方便与 否的角度去分类,去请教柳宗元研究方面的专家,就会发现 柳宗元数据库可以按以下五个板块进行分类。

1.版本模块。将收录不同时期各种版本的柳宗元文集, 同时采用影像和数字化技术加以保存。

2.史料笔记模块。主要收录与柳宗元的生平、交游和创 作情况相关的史料笔记。

3.地理方志模块。主要收录与柳宗元相关的地理、方志资料及通过田野调查获得的数据(图片)。

4.诗文评类模块。主要收录历代学人对柳宗元及其作品 的评价。

5.海外文献模块。主要收录日本、韩国等保存的与柳宗 元相关的文献资料及学者的研究成果。

如这样分类,将比四部分类更准确,更方便学者研究。

以上都是强调专家在数据库建设中的作用,但这并不意 味着数据库的技术开发者就不重要了。事实上,专家们虽然 掌握了一定数量的资料,但这些资料利用效率是高还是低, 还得依靠技术。当前,随着现代电子技术越来越发达,数据 库的作用不仅仅有联合检索功能,而且越来越趋向于智能化 了。如北大李铎教授主持的《全唐诗电子检索系统》,就能 对《全唐诗》的用韵进行分析,可以分析出在《全唐诗》中 哪些属于古体诗,哪些属于近体诗。这一项工作,如果用人 工去统计,则不知要花费多少时间,统计结果还不一定准确。

深圳大学开发的《红楼梦全文数据库》则更是专业化了,该 系统分为若干个专题,直接可以检索出相关资料,为红学研 究者提供了极大的方便。还有的数据库系统能根据诗文中出 现的词语的频率,分析出作家作品的情感特质。“凭借电子 文献的便利而做穷尽式研究,也是过去所不敢想的。”[2] 另外,也可以对一些成熟的技术升级换代,如数据库中的联 机字典。这一技术目前已相当成熟,但由于缺乏研究人员的 指导,技术开发者大多只是选择极为普通的字典作为联机字典。对于普通的读者而言,这样的字典也许能够满足阅读的 需要,但对于研究者而言,并无多大益处。如果技术开发者 征求了学术研究者的意见,联机功能将对学术研究起巨大的 推动作用。我们试想,如果技术开发者在程序中植入《说文 解字》《尔雅》《释名》《方言》《康熙字典》等,对于那 些给作品作校释、校注的人而言,是否带来极大的方便呢? 可见,专业化数据库的建设,离不开技术的研发者和学术研 究者共同的努力。

专业化、小型化的数据库所带来研究的方便性,不是那 些大型化数据库所能达到的。专业化数据库的建设减少了学 者查找文献的麻烦,不必为了某个版本奔波于各大图书馆之 间,不必为了解该领域的学术史而钻入到浩瀚的文献之中, 同时,还可以通过智能化的分析手段得出准确而科学的结论。

如建设柳宗元数据库,不仅能满足于柳宗元资料检索的功能, 还要对柳宗元相关资料,特别是《柳宗元集》中的文本进行 智能化分析,分析其文本的分类、文本的内容,文本的特质 等。研究者可以借助这些智能化手段分析出来的结果,进行 更深入研究,也可以用这些分析出来的结果判断自己研究得 出的结论是否具有科学性。

但专业化数据库建设遇到了颈瓶,与大型数据库,特别 是那些普及型数据库相比,专业化数据库的建设投入的人力、 物力虽然少一些,但也存在相当大的难度。比如资料的搜集 难度就很大,不少资料还需要去国外搜集,而且这些资料数据化过程中,包括文字的录入,都不是普通人员能够完成的。

如果遇到国外文献,数据库建设的难度可能会进一步增加。

投入如此多的人力和物力建立起来的数据库,在使用率上远 不如大型数据库高,也许只有同行业、同研究方向的人才会 使用。使用的人越少,带来的经济效益也就越少,这势必会 导致使用者承担的费用更高。这样会形成一个恶性循环,当 使用者承担的费用越来越高时,将会进一步限制使用者的数 量,这也就是近年来专业化数据库建设与大型数据库建设相 比严重滞后的根本性原因。

但这并不意味着开发专业化数据库作用不大,实际上还 是很有价值的。一旦专业化数据库建立起来,它不仅会提高 学者的研究效率,还会提升研究的准确性。而且它影响的不 只是一批学者,而是一代学者,甚至数代学者。它会促进某 个专业、某个方向的研究发生根本性变革。但专业化数据库 面临的困境是现实存在的,这是专业化数据库技术的开发者 和资料的整理者所面临的问题,这个问题也不是学者、数据 库技术开发者所能够解决的。要想解决这一问题,首先国家 要从政策性层面加以引导,要给予这些专业化数据库建设更 多资助,更多立项。二是加强与地方政府合作,特别是文化 类的数据库,大多和地方文化结合紧密,地方政府对此类数 据库建设要多从经费层面进行支持。

只有把数据库技术的开发者、学者和相关政府部门联合 起来,专业化数据库才有可能建立起来,数据库建设也才有可能更加专业化。

推荐内容

钻爱网 www.zuanai.cn

Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1

Top