期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:計算機(jī)信息管理時間:瀏覽:次
所謂詞匯控制,是指依據(jù)信息資源標(biāo)引和檢索的須要,對天然言語中的詞匯進(jìn)行抉擇、標(biāo)準(zhǔn)并提醒其相干性的歷程。天然言語作為一種人際交換和思想的工具,其詞匯具備運(yùn)用靈巧、表白性強(qiáng)等特征,但絕對檢索請求來說,含意不夠正確,缺乏明白的構(gòu)造,詞匯量也過大。因而,必需依據(jù)檢索體系請求,對詞匯進(jìn)行抉擇和處理。過度的詞匯控制關(guān)于樹立一個高效的信息組織和檢索體系是非常必要的。
分類體系對詞匯的控制重要包含:同義控制、詞義控制和詞間關(guān)系控制三個方面【1】,本文重要繚繞這三個方面進(jìn)行探討鉆研。
1 傳統(tǒng)分類法詞匯控制
傳統(tǒng)分類法的形成原理中,詞匯控制是一個重要的方面。
1。1 同義控制
即對字面情勢不同、涵義雷同的詞進(jìn)行控制,使一個概念只用一個語詞表白,目標(biāo)是戰(zhàn)勝天然言語中的一義多詞景象。
分類法對詞匯的同義控制重要表如今類名的抉擇上。類名即類目標(biāo)稱號,規(guī)矩著類目標(biāo)含意和內(nèi)容規(guī)模。當(dāng)碰到一義多詞狀況時,傳統(tǒng)分類法的選詞準(zhǔn)則個別是:采取能正確反應(yīng)其含意且對照通行的科學(xué)名詞,而不抉擇其俗稱、舊稱、不能正確表白全稱原義的簡稱、不通行的譯名或近義詞等【2】。如有必要,也可將這些落選的同義詞、近義詞用括號加注于類名后,或設(shè)置交替類目、用代參照。
1。2 詞義控制
即對同形異義詞和語義隱約的詞進(jìn)行控制,使得詞義明白,一個詞語只示意一個概念,戰(zhàn)勝天然言語中的一詞多義景象。
傳統(tǒng)分類法重要通過類目注釋來對詞義進(jìn)行控制。類目注釋有多品種型,包含內(nèi)容注釋、關(guān)系注釋、編列方法注釋、分類方法注釋、沿革注釋等。個別在類目內(nèi)容注釋中作詞義控制,對類目標(biāo)涵義加以解釋,或?qū)︻惸繕?biāo)內(nèi)容規(guī)模加以辨別,指導(dǎo)某類蘊(yùn)含與不蘊(yùn)含的內(nèi)容。如中圖法第四版類目“TB47工業(yè)設(shè)計”的注釋:“工業(yè)設(shè)計是工程技巧與美學(xué)藝術(shù)相聯(lián)合的新學(xué)科”。
1。3 詞間關(guān)系控制
指提醒詞匯之間的各種聯(lián)絡(luò)使其成為一個語義相干的體系,目標(biāo)是用以滿意擴(kuò)檢、縮檢、轉(zhuǎn)變檢索方向等的須要。詞匯之間的聯(lián)絡(luò),重要包含同等、等級、相干三種基本類型。
因為傳統(tǒng)分類法以分類標(biāo)志作為概念標(biāo)識,將體系開展的類目體系作為重要檢索門路,因而,詞間關(guān)系控制成為其詞匯控制的中央。分類體系重要采取體系方法開展,通過層層劃分,形成其具備附屬、并列關(guān)系的秩序井然的概念等級體系。將主題之間附屬、并列、相干等聯(lián)絡(luò)加以體系展現(xiàn),同時將類目之間的參照作為提醒類目之間橫向聯(lián)絡(luò)的一種彌補(bǔ)手腕。類目參照個別用于內(nèi)容聯(lián)絡(luò)具備提醒價值、但在分類體系中被疏散了的類目之間,通常采取互逆的方法在相干門類下注明。
2 網(wǎng)絡(luò)分類體系詞匯控制現(xiàn)狀
以下從同義控制、詞義控制及詞間關(guān)系控制三個方面來對網(wǎng)絡(luò)分類體系詞匯控制的現(xiàn)狀與傳統(tǒng)分類法進(jìn)行對照剖析。
2。1 同義控制
在類目稱號上,傳統(tǒng)分類法的類名力圖科學(xué)、正確、標(biāo)準(zhǔn),而網(wǎng)絡(luò)分類法在類名抉擇上更注重面向各類網(wǎng)絡(luò)用戶,力圖艱深易懂、時新,類名也更為精練。因而,招致類名不標(biāo)準(zhǔn)的景象在各網(wǎng)絡(luò)分類體系尤其是在其三級及以下類目中廣泛存在,成為詞匯控制中一個突出的問題【3】。如雅虎中國的一個三級類目名“親子”,搜狐的一個三級類目名“拓展”。
至于落選的同義詞,個別不樹立用代參照或設(shè)置交替類目,但可作為入口詞。如在供給類目索引的雅虎中國中,在檢索框中輸出“腳踏車”,檢索后果會將你指引向“自行車”【4】。
2。2 詞義控制
網(wǎng)絡(luò)分類體系中,也廣泛存在類名用語隱約招致難以判定其內(nèi)涵的景象。傳統(tǒng)分類法中的詞義控制手腕如含意注釋和規(guī)模注釋也很少采取,個別只在一級大類下有抉擇地羅列重點(diǎn)或熱門下位類來贊助明白其類名含意。如Yahoo!中,在一級大類“Business & Economy”下列出局部一級類“B2B,F(xiàn)inance,Shopping,Jobs”【5】;在Open Directory中,一級大類“Business”下列出局部二級類“Jobs,Real Estate,Investinn”【6】。
2。3 詞間關(guān)系控制
與傳統(tǒng)分類法一樣,等級式類目體系也是網(wǎng)絡(luò)分類法進(jìn)行詞間關(guān)系控制的重要手腕。傳統(tǒng)分類法基本上是采取線性情勢提醒類目之間聯(lián)絡(luò)的,這是文獻(xiàn)組織的須要和傳統(tǒng)檢索環(huán)境的特征所抉擇的。盤算機(jī)的運(yùn)用,特殊是超文本技巧的運(yùn)用轉(zhuǎn)變了這一狀況。超文本技巧的特征是,可以通過節(jié)點(diǎn)之間的鏈接,以非線性的方法充足提醒和表白信息之間的聯(lián)絡(luò)。這一特征極大地改良了網(wǎng)絡(luò)分類法中類目之間各種關(guān)系的提醒,尤其是多維關(guān)系的提醒。這是超文本技巧的強(qiáng)項,也是傳統(tǒng)分類法中的一個軟弱環(huán)節(jié)。目前,網(wǎng)絡(luò)分類體系中對多維關(guān)系的提醒對照充足,個別均通過鏈接的方法,在相應(yīng)類下反復(fù)反應(yīng)。但如在處理歷程中缺乏一致性及對運(yùn)用規(guī)模的過度控制,也會形成類目關(guān)系的雜亂。此外,繁多的反復(fù)反應(yīng)并不能簡樸替代相干關(guān)系的提醒【7】。
在附屬、并列關(guān)系的提醒上,網(wǎng)絡(luò)分類體系目前也存在一些問題,如類目歸屬存在著不合理景象,同位類排列不能提醒類間關(guān)系等。
3 網(wǎng)絡(luò)分類體系詞匯控制改良倡議
網(wǎng)絡(luò)分類目錄是因特網(wǎng)上用戶罕用的兩種信息檢索工具之一,對網(wǎng)上海量的混淆無序的信息起偏重要的導(dǎo)航作用。網(wǎng)絡(luò)分類體系詞匯控制的基本目標(biāo)是進(jìn)步檢索效力,因而,筆者以為網(wǎng)絡(luò)分類體系的一切詞匯控制改良倡議都應(yīng)以進(jìn)步檢索效力為前提。
3。1 繼承維持天然言語的主體檢索言語位置
目前,在大多數(shù)信息存儲與檢索體系中,天然言語和人工受控言語處于并存狀況,互相揚(yáng)長避短。隨著Internet的遍及開展,信息檢索最終用戶日趨強(qiáng)大,天然言語檢索浮現(xiàn)敏捷開展趨勢。如前所述,網(wǎng)絡(luò)分類檢索體系中詞匯控制具備與傳統(tǒng)分類體系不同的特征,天然言語在體系中完整占領(lǐng)了主體位置。從基本上看,這是由天然言語檢索的特征和網(wǎng)絡(luò)用戶的檢索需求特征所抉擇的。
傳統(tǒng)分類法的編制重要針對印刷型文獻(xiàn)的特征用以編制分類目錄和組織分類排架,而網(wǎng)絡(luò)信息分類體系旨在為網(wǎng)上信息供給指引,樹立與宗旨信息的疾速有效的鏈接。網(wǎng)絡(luò)信息分類體系面向的是寬廣網(wǎng)絡(luò)用戶而不是圖書情報專業(yè)人員。與本來的專業(yè)檢索人員相比,網(wǎng)絡(luò)用戶的規(guī)模非常廣泛,他們的教導(dǎo)水平、常識構(gòu)造、專業(yè)技巧、興致興致各不雷同,對同一事物、同一律念的了解也不盡雷同。因而,為了增添網(wǎng)絡(luò)分類體系對個別用戶的易用性,現(xiàn)有的網(wǎng)絡(luò)分類體系都盡量采取天然言語,而防止學(xué)術(shù)性、專業(yè)性過強(qiáng)的詞匯,從而向群眾供給易于控制、運(yùn)用的分類查問體系。
天然言語因為其與生俱來的詞義隱約、詞間關(guān)系不清等特征形成不少的漏檢和誤檢,與人工言語相比,檢索效力較低。但從用戶角度來說,天然言語具備奇特的優(yōu)勝性,如天然言語時新性強(qiáng),一旦網(wǎng)頁中涌現(xiàn)某個新概念詞語,即可間接運(yùn)用這一新詞作為檢索入口,而不用要轉(zhuǎn)換成另一標(biāo)準(zhǔn)詞用于檢索。而且天然言語檢索不便,它解除了受控言語的種種限制,不須要龐雜的檢索規(guī)矩,運(yùn)用者可以較快適應(yīng)、易用性突出。
當(dāng)然,要想取得滿意的檢索后果,對天然言語的過度控制是不可缺乏的,這包含樹立機(jī)內(nèi)癥結(jié)詞詞典、類主題詞典和后控制詞表等。有理由信任隨著相干技巧的日益進(jìn)步,天然言語的優(yōu)勝性將越來越明顯,網(wǎng)絡(luò)分類檢索體系也將日臻完美,取得人們的廣泛歡送。
綜上所述,為了匆匆進(jìn)網(wǎng)絡(luò)分類體系的廣泛運(yùn)用,天然言語在其中作為主體檢索言語的位置須要繼承維持上來。
3。2 過度借鑒傳統(tǒng)分類法和主題法的詞匯控制手腕
傳統(tǒng)分類法重要通過其層層開展的周密的類目體系來進(jìn)行詞匯控制。其體系的類目體系使得體系地控制和運(yùn)用一個學(xué)科或?qū)I(yè)規(guī)模的常識和信息很不便,關(guān)于從學(xué)科或?qū)I(yè)起程的泛指性檢索能到達(dá)較高的檢全率,而且能不便地進(jìn)行擴(kuò)檢和縮檢。傳統(tǒng)主題法體系,個別以詞匯為單元進(jìn)行控制,重要通過參照體系和各種輔佐索引來展現(xiàn)詞間關(guān)系,在主題詞的抉擇、詞義控制方面比分類法更為嚴(yán)厲。主題法的特征是以主題為中央集中信息資源,能正確、專指地標(biāo)引和提醒各種主題內(nèi)容,檢索的間接性、通用性好,適宜于進(jìn)行專指性檢索,而且可通過靈巧組配方法進(jìn)行多門路檢索,到達(dá)較好的運(yùn)用后果。
現(xiàn)有網(wǎng)絡(luò)分類法因為運(yùn)用超文本技巧提醒詞間關(guān)系,采取多重列類的方法,從不同的屬性、角度設(shè)置類目,從而供給從多個方面提醒信息資源的方法,增添了檢索入口,不便用戶從不同角度查找。這是其在檢索上相干于傳統(tǒng)分類法和主題法檢索體系最大的劣勢。但從目前檢索實(shí)際來說,其檢索效力遠(yuǎn)不及后者,究其起因,詞匯控制是其中一個很重要的因素。因而,要改良網(wǎng)絡(luò)分類體系的檢索效力,借鑒傳統(tǒng)分類法和主題法成熟的詞匯控制手腕是一個可行的方法【8】。
首先,在類目體系設(shè)計上,網(wǎng)絡(luò)分類體系廣泛存在著類目設(shè)置缺乏法則性、類目歸屬不合理、同位類排列雜亂、橫向關(guān)系提醒不一致等問題,而這些問題在傳統(tǒng)分類法中都相應(yīng)地有很成熟的技巧或商定俗成的做法可借鑒。
其次,在類名抉擇上可借鑒傳統(tǒng)主題法詞匯抉擇的準(zhǔn)則和方法或間接選用其主題詞。類目稱號不標(biāo)準(zhǔn)是目前各種網(wǎng)絡(luò)分類體系的一大通病。作為面向最終用戶的檢索體系來說,采取寬廣網(wǎng)民所膾炙人口的稱呼是無可非議的,但關(guān)于類目命名還是要進(jìn)行恰當(dāng)?shù)臉?biāo)準(zhǔn)化處理。現(xiàn)有的網(wǎng)絡(luò)分類體系大多屬于等級式主題分類法體系,以主題充任類目。因而,借鑒傳統(tǒng)主題法詞匯抉擇的準(zhǔn)則和方法或間接選用其主題詞不失為改良詞匯控制的一個捷徑。
另外,在詞義控制上,可采取傳統(tǒng)分類法和主題法所罕用的手腕,包含加限義詞、增設(shè)含意注釋和規(guī)模注釋等,以進(jìn)一步明白類目標(biāo)內(nèi)涵和內(nèi)涵。這有助于用戶在查問體系時疾速、正確抉擇類目,加強(qiáng)體系的用戶友愛性,從而到達(dá)改良檢索后果的目標(biāo)。
3。3 樹立一致的詞匯控制機(jī)制
許多海內(nèi)外著名的綜合性門戶網(wǎng)站如Yahoo、Excite、Infoseek、搜狐、網(wǎng)易等都研制有本人的網(wǎng)絡(luò)分類檢索工具,供給分類閱讀式查問。這些各具特征的網(wǎng)絡(luò)分類體系給網(wǎng)上信息檢索帶來了極大的不便。這些分類體系的大類設(shè)置與劃分、類名的表述與內(nèi)涵、類目標(biāo)排列等各不雷同,檢索性能也有較大的差別。而用戶在查問網(wǎng)絡(luò)信息時通常會運(yùn)用多種分類檢索工具,這就形成了用戶了解和運(yùn)用的艱難,更不利于網(wǎng)上信息資源的共建和共享。
傳統(tǒng)分類法也曾是多種多樣的,但目前在海內(nèi)上占主導(dǎo)位置的只要DDC、UDC和LCC,在我國則是《中圖法》和《科圖法》。綜合性的分類法趨勢對立是信息資源共享趨勢的后果。互聯(lián)網(wǎng)上信息資源的最大特征之一就是它的共享性。常識組織體系的絕對對立將為基于網(wǎng)絡(luò)的資源共享供給不便。因而,編制適應(yīng)網(wǎng)上信息組織和檢索的對立分類體系已成為急切須要處理的問題。樹立一致的詞匯控制機(jī)制是對立分類體系的非常重要的一環(huán),關(guān)于推進(jìn)網(wǎng)絡(luò)分類法的進(jìn)一步開展具備重要的意義。
樹立一致的網(wǎng)絡(luò)信息分類體系詞匯控制機(jī)制,應(yīng)當(dāng)由圖書情報專業(yè)人員參加,以現(xiàn)有的傳統(tǒng)分類體系主題法詞匯控制機(jī)制為基本,排匯已有的網(wǎng)絡(luò)分類體系的詞匯控制經(jīng)歷和后果,遵照面向網(wǎng)絡(luò)信息資源、面向網(wǎng)絡(luò)技巧環(huán)境、面向網(wǎng)絡(luò)用戶的準(zhǔn)則。其詞匯控制機(jī)制重要包含同義控制、詞義控制、詞間關(guān)系控制方面的原理、準(zhǔn)則、方法和技巧等,此外,還包含詞量控制、詞組抉擇和運(yùn)用的控制、專指度的控制等方面的內(nèi)容。
最后,在詞匯控制機(jī)制一致的基本上,構(gòu)建絕對對立的網(wǎng)絡(luò)信息分類法。所謂絕對對立,是指在對立網(wǎng)絡(luò)分類體系基本原理包含詞匯控制機(jī)制的基本上,保存并改良現(xiàn)有的多樣的網(wǎng)絡(luò)分類體系,許可多種有特征有實(shí)力的分類體系共存開展。因為不同的網(wǎng)絡(luò)分類體系在類目體系和資源抉擇上往往都有本人的特征,在滿意不同用戶需求或檢索特定資源時有其獨(dú)到之處【7】。此外,多樣性必定招致網(wǎng)絡(luò)分類體系之間的競爭,為了爭奪用戶,開發(fā)者不得不針對用戶的需務(wù)實(shí)時地改良,這就使得全部網(wǎng)絡(luò)分類體系的性能得到天然的晉升,從而推進(jìn)網(wǎng)絡(luò)分類法逐漸走向成熟和完美【9】。
【參考文獻(xiàn)】
1 馬張華。信息組織(第二版)【M】。北京:清華大學(xué)出版社,2003。14-15。
2 張琪玉。情報言語學(xué)基本(第二版)【M】。武漢:武漢大學(xué)出版社,1997。44-47。
3 黃如花。網(wǎng)絡(luò)信息組織:情勢與評估【M】。北京:北京圖書館出版社,2003。89-91。
4 http:÷÷cn。yahoo。com,2004-10-11。
5 http:÷÷www。yaboo。com,2004-10-11。
6 http:÷÷dmoz。org÷,2004-10-11。
7 劉穎。試論網(wǎng)絡(luò)信息分類的現(xiàn)狀與將來——構(gòu)建對立的網(wǎng)絡(luò)信息分類法【J】。晉圖學(xué)刊,2003,(1):21-23。
8 周寧,黃曉梅,等。信息組織【M】。武漢:武漢大學(xué)出版社,2001。74-77。
9 杜安平。網(wǎng)絡(luò)分類體系基本原理鉆研【J】。圖書館學(xué)鉆研,2004,(4):60-62。