期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
所屬分類:期刊常識時(shí)間:瀏覽:次
[摘 要]大數(shù)據(jù)和大數(shù)據(jù)技術(shù)推動下,智能文獻(xiàn)采訪將成為圖書館文獻(xiàn)采訪的發(fā)展方向和趨勢。結(jié)合大數(shù)據(jù)技術(shù)和圖書館文獻(xiàn)采訪的業(yè)務(wù)工作,研究文獻(xiàn)采訪大數(shù)據(jù)的組成和相互關(guān)系,探索基于大數(shù)據(jù)技術(shù)的智能文獻(xiàn)采訪模式及具體方法。同時(shí),指出實(shí)現(xiàn)文獻(xiàn)智能采訪需要培育的幾個(gè)方面的內(nèi)容。
[關(guān)鍵詞]大數(shù)據(jù);大數(shù)據(jù)技術(shù);智能文獻(xiàn)采訪;模式
	
基于云計(jì)算機(jī)、物聯(lián)網(wǎng)等基礎(chǔ)的大數(shù)據(jù)技術(shù)發(fā)展和應(yīng)用逐漸深入到各行業(yè)。大數(shù)據(jù)所涉及的信息量規(guī)模巨大,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、整理成類并能夠解讀的數(shù)據(jù)資訊,根據(jù)應(yīng)用動態(tài)分配資源。大數(shù)據(jù)及其相關(guān)技術(shù),讓圖書館、讀者、供應(yīng)商和大數(shù)據(jù)企業(yè)間的智能文獻(xiàn)采訪成為可能[1]。利用大數(shù)據(jù)及其技術(shù),能方便獲取讀者閱讀需求、供應(yīng)商、出版商以及網(wǎng)絡(luò)信息數(shù)據(jù)來智能分析、管理和預(yù)測讀者需求、文獻(xiàn)動態(tài)和采訪細(xì)節(jié),并以智能虛擬化的方式為圖書館采訪員、讀者用戶間構(gòu)建實(shí)現(xiàn)智能文獻(xiàn)采訪,從而提高采訪的質(zhì)量、準(zhǔn)確性,降低采購成本、管理成本,提升文獻(xiàn)采訪效率。
1 大數(shù)據(jù)、大數(shù)據(jù)技術(shù)概述
大數(shù)據(jù)(Bib Data)是指所涉及的規(guī)模巨大的數(shù)據(jù),于2011年由麥肯錫提出。大數(shù)據(jù)是無法用現(xiàn)有軟件工具提取、存儲、搜索、共享、分析和處理的、海量的、復(fù)雜的數(shù)據(jù)集合,是需要使用新的處理模式才能具有更強(qiáng)的決策力、洞察力、優(yōu)化能力的海量資產(chǎn)。大數(shù)據(jù)基本包括大交易數(shù)據(jù)、大交互數(shù)據(jù)。大交易數(shù)據(jù)是指財(cái)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)、經(jīng)銷商數(shù)據(jù)、員工數(shù)據(jù)等。大交互數(shù)據(jù)是指微博、微聊天數(shù)據(jù)、移動終端數(shù)據(jù)、地理位置等數(shù)據(jù)。這兩部分?jǐn)?shù)據(jù)共同融合成為全面大數(shù)據(jù)。2012年美國啟動大數(shù)據(jù)研究,隨后日本、歐盟、法國、澳大利亞陸續(xù)進(jìn)行大數(shù)據(jù)研究。2013年我國啟動大數(shù)據(jù)建設(shè),至2015年越來越多的政府和企業(yè)建立大數(shù)據(jù)產(chǎn)業(yè)園和創(chuàng)業(yè)平臺。如百度、淘寶、京東等企業(yè)建立了商品大數(shù)據(jù)[2]。
大數(shù)據(jù)具有“4V”特征,即數(shù)據(jù)巨大、數(shù)據(jù)類型多樣、處理速度快、價(jià)值密度低。大數(shù)據(jù)是動態(tài)的、開放性的、多樣化的。隨著海量的大數(shù)據(jù)產(chǎn)生,對數(shù)據(jù)處理的實(shí)時(shí)性、有效性提出了更高要求。然而傳統(tǒng)的常規(guī)技術(shù)手段根本無法應(yīng)付。在這種情況下,大數(shù)據(jù)技術(shù)應(yīng)運(yùn)而生。這些技術(shù)主要包括分布式緩存、基于MPP的分布式數(shù)據(jù)庫、分布式文件系統(tǒng)、各種NoSQL分布式存儲方案等。NoSQL數(shù)據(jù)庫技術(shù)主要實(shí)現(xiàn)搜索、實(shí)時(shí)統(tǒng)計(jì)分析、簡單事務(wù)等[2]。Hadoop數(shù)據(jù)分析技術(shù)主要實(shí)現(xiàn)用戶積累、數(shù)據(jù)整合和分析處理等方位的服務(wù)。隨著數(shù)據(jù)挖掘技術(shù)、聚類分析、可視分析、預(yù)測分析和數(shù)據(jù)管理等大數(shù)據(jù)技術(shù)的不斷發(fā)展和完善,逐漸實(shí)現(xiàn)數(shù)據(jù)的多維度采集、整理、分析、預(yù)測和管理信息源,挖掘出有價(jià)值的信息及隱藏在數(shù)據(jù)背后的信息,進(jìn)而揭示事物的本質(zhì)及其發(fā)展規(guī)律。
2 大數(shù)據(jù)技術(shù)給文獻(xiàn)采訪帶來的影響
隨著人工智能、專家系統(tǒng)技術(shù)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等的發(fā)展應(yīng)用,智能采購系統(tǒng)的數(shù)據(jù)挖掘、預(yù)測、分析等技術(shù)已取得重大進(jìn)展。大數(shù)據(jù)驅(qū)動采購變革已開始,不斷把數(shù)據(jù)拿出來分析和關(guān)聯(lián),進(jìn)行合理的預(yù)測和數(shù)據(jù)推送。已有人嘗試將部分技術(shù)運(yùn)用于圖書館文獻(xiàn)采訪工作的理論與實(shí)踐。隨著大數(shù)據(jù)技術(shù)進(jìn)一步完善,為智能文獻(xiàn)采訪實(shí)現(xiàn)提供技術(shù)支持,這也是人工智能整體發(fā)展的必然趨勢。大數(shù)據(jù)技術(shù)支持下,智能文獻(xiàn)采訪不再高度依賴采購員的主觀經(jīng)驗(yàn),而是根據(jù)大數(shù)據(jù)挖掘、個(gè)性化文獻(xiàn)需求,自動生成采購?fù)扑]清單,高度智能地完成文獻(xiàn)采訪工作。智能文獻(xiàn)采訪系統(tǒng)通過對讀者用戶各方面數(shù)據(jù)、館藏?cái)?shù)據(jù)、書目數(shù)據(jù)、文獻(xiàn)價(jià)值、經(jīng)費(fèi)分配、風(fēng)險(xiǎn)等等進(jìn)行全面分析、比較、判斷、評價(jià),最后做出科學(xué)的文獻(xiàn)采訪。同時(shí),通過挖掘數(shù)據(jù)價(jià)值、發(fā)現(xiàn)規(guī)律和知識為文獻(xiàn)采訪決策和優(yōu)化提供有利依據(jù),指導(dǎo)文獻(xiàn)采訪和管理的改進(jìn),最終改善文獻(xiàn)采訪的運(yùn)營,實(shí)現(xiàn)便捷、高效及環(huán)保的文獻(xiàn)采購[3—4]。
3 文獻(xiàn)采訪大數(shù)據(jù)的構(gòu)成
在大數(shù)據(jù)技術(shù)和環(huán)境下,聯(lián)系文獻(xiàn)采訪業(yè)務(wù)技術(shù)流程,可將文獻(xiàn)采訪大數(shù)據(jù)分為讀者數(shù)據(jù)、圖書館數(shù)據(jù)、供應(yīng)商數(shù)據(jù)、企業(yè)大數(shù)據(jù)四個(gè)部分[1]。
3.1 讀者數(shù)據(jù)
讀者數(shù)據(jù)分為讀者用戶身份數(shù)據(jù)和讀者交互數(shù)據(jù)。讀者交互數(shù)據(jù)是指讀者的行為數(shù)據(jù),主要是指讀者點(diǎn)擊、瀏覽、停留記錄、檢索、閱讀、借閱、購買等信息數(shù)據(jù),也包含讀者與供應(yīng)商和其他網(wǎng)絡(luò)平臺進(jìn)行溝通聯(lián)系產(chǎn)生的一切數(shù)據(jù)。讀者身份數(shù)據(jù)是用于在大數(shù)據(jù)間進(jìn)行溝通的數(shù)據(jù),如身份信息。
3.2 圖書館數(shù)據(jù)
圖書館數(shù)據(jù)是指館藏文獻(xiàn)數(shù)據(jù)、采訪員數(shù)據(jù)、讀者基本信息。該數(shù)據(jù)也存在讀者用戶訪問圖書館網(wǎng)站、微信、微博等信息的讀者交互數(shù)據(jù)。
3.3 供應(yīng)商數(shù)據(jù)
供應(yīng)商數(shù)據(jù)是指文獻(xiàn)資源數(shù)據(jù)、讀者交互數(shù)據(jù)。文獻(xiàn)資源數(shù)據(jù)主要是文獻(xiàn)出版信息、文獻(xiàn)采購信息、采購交易等數(shù)據(jù)。這里的讀者交互數(shù)據(jù)是指讀者參與圖書供應(yīng)商瀏覽、自主采購或推薦等信息。
3.4 企業(yè)大數(shù)據(jù)
企業(yè)大數(shù)據(jù)是指圖書館、供應(yīng)商、讀者共同依靠的互聯(lián)企業(yè)所提供的有關(guān)文獻(xiàn)資源、大眾讀者以及閱讀、交易等信息。如百度、騰訊、阿里開放數(shù)據(jù)庫等。企業(yè)大數(shù)據(jù)是最廣泛數(shù)據(jù),也是文獻(xiàn)采訪挖掘、預(yù)測、精確采購的數(shù)據(jù)集合。文獻(xiàn)采訪大數(shù)據(jù)相互間的結(jié)構(gòu)關(guān)系如圖1所示。
4 基于大數(shù)據(jù)庫技術(shù)的智能文獻(xiàn)采訪模式分析
4.1 文獻(xiàn)采訪數(shù)據(jù)的收集
在大數(shù)據(jù)環(huán)境下,通過大數(shù)據(jù)搜集讀者信息,利用大數(shù)據(jù)準(zhǔn)確了解每位讀者的文獻(xiàn)需求。這些讀者數(shù)據(jù)的搜集主要通過圖書館、供應(yīng)商和大數(shù)據(jù)企業(yè),還包括通過進(jìn)行數(shù)據(jù)分析后獲得的決策數(shù)據(jù)。供應(yīng)商開放的文獻(xiàn)采訪平臺擁有文獻(xiàn)資源數(shù)據(jù)。企業(yè)大數(shù)據(jù)依靠的是互聯(lián)網(wǎng)企業(yè)所提供的有關(guān)文獻(xiàn)資源、大眾讀者以及閱讀、交易等信息。這些數(shù)據(jù)為供應(yīng)商營銷和圖書館文獻(xiàn)采訪提供參考、預(yù)測數(shù)據(jù)。接下來需要將這些數(shù)據(jù)進(jìn)行整合。其具體辦法可找到一關(guān)鍵字段把兩個(gè)或多個(gè)數(shù)據(jù)進(jìn)行連接,如讀者通過身份證號碼在圖書館網(wǎng)站、供應(yīng)商平臺和互聯(lián)網(wǎng)大數(shù)據(jù)企業(yè)間進(jìn)行連接。通過這種方式,可以對讀者的基本資料、行業(yè)特征和交易記錄形成全方面了解。整理完讀者數(shù)據(jù)之后按一定的邏輯給讀者打標(biāo)簽。如這個(gè)讀者最近經(jīng)常瀏覽孕婦服裝、奶粉,可以給讀者打上“孕婦”標(biāo)簽。通過讀者數(shù)據(jù)來全方位地了解讀者,以便為下一步精準(zhǔn)文獻(xiàn)采訪奠定基礎(chǔ)。當(dāng)這些讀者數(shù)據(jù)越來越大,企業(yè)就將這些讀者數(shù)據(jù)進(jìn)行存放,為文獻(xiàn)采訪、供應(yīng)商的銷售提供科學(xué)、智能的預(yù)測。同時(shí),圖書館館藏種類、數(shù)量和結(jié)構(gòu)等通過圖書館采訪系統(tǒng)與供應(yīng)商開放平臺互通連接[5]。
推薦閱讀:大數(shù)據(jù)挖掘的論文投刊指導(dǎo)
如果您現(xiàn)在遇到期刊選擇、論文內(nèi)容改善、論文投稿周期長、難錄用、多次退修、多次被拒等問題,可以告訴學(xué)術(shù)顧問,解答疑問同時(shí)給出解決方案 。