本文摘要:摘要:[目的/意義]圖書館學發展的數據化勢不可擋,探索、發現、掌握和適應其中規律將對圖書館學基礎理論研究產生重要影響。[方法/過程]本文使用CiteSpace工具,以近五年國內圖書館學關于數據的文獻為研究對象,得出圖書館學發展數據化的三個熱點研究領域。采
摘要:[目的/意義]圖書館學發展的數據化勢不可擋,探索、發現、掌握和適應其中規律將對圖書館學基礎理論研究產生重要影響。[方法/過程]本文使用CiteSpace工具,以近五年國內圖書館學關于數據的文獻為研究對象,得出圖書館學發展數據化的三個熱點研究領域。采用問卷調查和訪談的方法討論圖書館學發展數據化的趨勢、成因和策略。[結果/結論]圖書館學發展的確存在數據化趨勢并且集中在五個方面,呈現四個梯度。在此基礎上,發現圖書館信息資源深度開發的需要、量化研究方法對圖書館學研究的影響和圖書館學學科邊界的拓展是圖書館學發展數據化的重要成因,并提出應對策略。
關鍵詞:圖書館學數據化圖書館實踐圖書館學研究圖書館學教育
1研究緣起
發展趨勢是一個學科基礎理論研究的核心內容,圖書館學對發展趨勢的研究亦呈百舸爭流的態勢?缕絒1]認為新技術、應用研究和數字化研究將對圖書館學發展產生持續影響;馬海群[2]提出學科交叉、技術應用、深度需求是未來圖書館學科發展的重要作用因素;楊愛軍[3]建議我國圖書館學應當注重層次化發展。除此之外,數據化成為圖書館學發展的新動向,圖書館學發展是否會形成數據化的趨勢,將對圖書館學基礎理論的研究產生重要影響。“數據化”(datafication)一詞是數據科學家維克托·邁爾-舍恩伯格(ViktorMayerSchonberger)和肯尼思·庫克耶(KennethCukier)提出的專業術語,描述了在網絡空間將社會行為轉化為在線量化數據的技術趨勢[4]。
圖書館論文范例:淺議公共圖書館地方文獻工作
圖書情報與檔案管理學科領域關于數據化的觀點主要集中在信息資源利用方式的變化,例如檔案數據化是將數字檔案資源轉換為可供閱讀、分析和處理的檔案數據資源的過程[5];歷史文獻數據化是將文獻轉化為可量化分析的數據[6]?紤]到一個學科的數據化除了研究客體,還需要包括研究方法,筆者認為圖書館學的數據化是圖書館學領域將數據作為研究客體或研究工具的狀況或現象,圖書館工作或圖書館學研究中挖掘數據、統計數據和分析數據等都是圖書館學數據化的具體表現。需要說明的是,數據化與數字化、知識化既有區別也緊密相連。數字化為數據化奠定了基礎,改變了信息的載體形式;知識化是對信息內容進行學習與創新的過程。數字化和知識化本質上都是對數據的加工處理,這與數據化是一致的。數據時代推進了圖書館學發展的數據化,探索、發現、掌握和適應圖書館學的數據化趨勢是圖書館人的任務與擔當。
2研究現狀
2.1數據來源與分析工具
由于目前關于圖書館學的數據化尚未有明確的定義,且根據CNKI期刊數據庫檢索發現關于圖書館學數據化的研究較少,為了提高查全率,本文以CNKI期刊數據庫為數據來源,將“篇名”檢索詞設置為“數據”,將檢索時間設置在2015—2020年,限定文獻分類為“圖書館學、圖書館事業”進行檢索,將檢索結果按照相關性排序,除去會議通知、征稿通知等與研究內容無關的題錄,最終得到有效文獻題錄2057條。借助可視化軟件CiteSpace,采用高頻關鍵詞的共現分析、聚類分析挖掘圖書館學關于數據的研究中包含的隱性知識,探索圖書館學關于數據的研究熱點以及發展現狀。
2.2文獻數量與研究熱點
文獻信息計量統計是科學基礎理論研究的一個重要環節,能夠一定程度上反映出某類研究在該學科領域的研究熱度。將圖書館學關于數據的研究進行信息計量統計,便于了解圖書館學發展數據化的基本情況。反映了2015—2020年圖書館學關于數據的研究文獻增長趨勢,2016年發文增長率最高,達到了30%,文獻數量在2019年達到峰值(2020年數據不完整,暫不做詳細分析)。圖譜方式可以直觀地反映關鍵詞之間的關系,如果某一關鍵詞或標題詞在其所屬領域反復出現,即為高頻次關鍵詞,可體現出該關鍵詞或標題詞所表征的研究主題是當前的研究熱點領域。
其中每個節點代表關鍵詞出現的頻次,節點越大代表相應的關鍵詞出現的越頻繁,反之,代表關鍵詞不經常出現。線表示節點之間的聯系,節點之間的連線越多代表節點間的聯系越緊密。下頁表1為檢出的2057篇文獻中頻次排名前十的關鍵詞,對其頻次進行求和,值為1286次,占文獻關鍵詞總頻次3216的46%。這些關鍵詞反映了該時間段我國圖書館學關于數據的研究熱點(高頻關鍵詞頻之和占全部關鍵詞總頻次的40%以上就能代表該領域的研究熱點。所獲取的文獻中頻次最高的關鍵詞是大數據,頻次為580,其次是高校圖書館、圖書館、數據素養和關聯數據等;知識圖譜、機構知識庫、元數據和個性化服務等關鍵詞中心度較高,與其他關鍵詞的聯系較為緊密,這些關鍵詞反映了2015—2020年圖書館學關于數據的熱點研究。
2.3研究領域分析
研究熱點反映的是學者們研究內容的集中,進而形成熱點研究領域。近些年,大數據成為學術界的“新寵”,而大數據受到追捧的關鍵在于通過加工實現數據的“增值”。圖書館是大量數據的集中地,自然而然地成為數據化的陣地,關于元數據、知識圖譜和機構知識庫的研究也同樣是將數據作為研究客體或研究工具的表現。
2.3.1圖書館實踐數據化
對于研究熱點的把握和追蹤,有利于更加精準地分析與掌握圖書館學發展的趨勢。通過詞頻分析,大數據、高校圖書館、圖書館、數據素養、關聯數據等高頻關鍵詞,體現的是圖書館學關于數據的熱點研究。大數據環境下信息技術加速迭代,圖書館的館藏資源建設、館員業務能力以及讀者服務面臨轉型升級。
王丹丹[8]提出應基于本地數據或多個機構的聯合數據來開展數據驅動的館藏建設;瞿浩[9]針對圖書館員數據管理的內涵、圖書館數據類型和圖書館員數據管理能力進行分析并提出相應的策略;羅鳳莉[10]認為運用圖書流通數據的關聯規則挖掘隱含關系,有利于調整館藏資源建設的學科結構、提升讀者服務的工作水平;曹嘉君等[11]構建了基于數據科學的知識創新服務模式。圖書館實踐的數據化為圖書館服務提供了新的途徑,加快了圖書館信息資源的更新與流通速度,提高了圖書館讀者服務的個性化水平,為信息傳遞提供了便捷的通道。圖書館實踐的數據化使得圖書館的服務模式突破時空限制,更有效地提升圖書館的數據管理水平。
2.3.2圖書館學研究數據化
圖書館學研究的數據化主要體現在圖書館學研究內容和研究方法的數據化。調查結果中的數據素養、數據關聯、科學數據和數據管理等高頻關鍵詞反映的是圖書館學研究內容的數據化拓展;知識圖譜、元數據、CiteSpace、語義網、數據挖掘等高中心度關鍵詞反映的是當前圖書館學研究的具體方法的數據化。
趙蕊菡[12]發現大數據時代,圖書館學的研究內容從以文獻為主轉變為以數據為主,研究熱點轉向科研數據的發現、存儲、使用與分享和利用開放科學整合信息資源;張曉琳[13]認為數據范式將成為一種新型圖書館學研究范式;趙蓉英等[14]提出利用可視化分析技術對數據科學的發展進行分析,研尋數據科學的演進軌跡;劉丹[15]通過建立面向關聯數據的學位論文元數據語義化原型,評估語義網技術在學位論文元數據上的應用效果。數據化為圖書館學研究提供新課題,隨著大數據、數據科學、人工智能的發展,大量數據可以被廣泛使用,將數據轉換成有用的信息和知識是當務之急,科研數據和元數據逐漸成為圖書館學研究的數據基礎。
2.3.3圖書館學教育數據化
“iSchool運動”發展至今已在世界圖書館學和情報學領域產生了深遠的影響,關于圖書館學專業教育的研究顯示,數據素養是學者們重點關注的話題,也是本次檢出的高頻關鍵詞。司莉等[16]以38所iSchool院校的138個圖書情報專業研究生項目為樣本,通過調查發現此類院校的數據素養課程注重培養學生的數據挖掘能力,強調在實踐中培養數據意識與數據倫理;曹樹金等[17]認為未來可以在我國數據素養課程設計、數據素養能力模型的構建、數據素養能力評估體系、指標建設等方面進行更為深入地探索;安璐等[18]構建了數據挖掘課程的知識體系。結合國內圖書館學專業院校的課程設置,發現近些年許多院校增設了“大數據分析導論”“數據可視化”“數據結構”等課程。這是圖書館學教育受到數據化影響的表現,學者們對數據的關注逐漸滲透于專業教育之中,數據泛在的環境下,培養具備數據素養、數據挖掘和數據管理能力的圖書館學研究者和實踐者亦是發展復合型人才的要求。
3趨勢調查
為了探究圖書館學發展的數據化趨勢能否長足發展,本文編制了關于“圖書館學數據化發展專家態度調查”的問卷,設置了總加量表、累積量表和開放式填空問答,為確保調查的客觀性、全面性和合理性,筆者邀請了10位專家進行調查。受訪者年齡在35~50歲之間,包含2位研究館員,1位圖書館學期刊主編,7位從事圖書館學教育和研究的資深學者(來自北京大學、武漢大學、南京大學、中山大學和河北大學)。學者研究方向涉及圖書館學理論、圖書館管理、數字圖書館、參考咨詢和圖書館學教育等方面,保證了專家群體科學性調查的質量。
3.1總加量表調查
調查圖書館學發展數據化的專家態度,受訪者的評估主觀性較強,因此采用態度測量技術(量表)進行調查。問卷第一部分采用總加量表統計數據對圖書館學的影響程度,根據研究領域分析,總加量表部分設置了數據對圖書館實踐、對圖書館學研究和對圖書館學教育的影響三個角度,共20個問題,專家態度平均分情況,在調查統計結果中,第一部分中每個項目的平均得分均大于3分,說明項目的設置是比較合理的。
專家態度評分中平均分最高的三個問題分別是“讀者的閱讀、訪問數據的分析和挖掘對于圖書館提供個性化服務的影響”“數據運用能力對于圖書館學專業學生就業的影響”和“數據素養對圖書館學學生專業能力的影響”,可見大多數專家認為數據對圖書館實踐和圖書館學教育兩個方面的影響較大;此外,關于數據對圖書館學研究的影響平均分最高值為4.3分,表示多數專家認為數據對圖書館學研究熱點的影響較大,最低值為3.8分,說明專家認為數據對圖書館學研究對象的影響較小。
3.2累積量表調查
問卷第二部分采用累積量表調查圖書館學發展數據化的影響因素,同樣以圖書館實踐、圖書館學研究和圖書館學教育三個領域為基礎,共設置12個問題。累積量表專家態度評分情況如下頁表4所示,專家根據個人觀點選擇數據是否對量表中的選項產生影響。專家評分情況可以清晰地顯示出所有選項得分均大于零,根據累積量表的記分法和得分原則,保留得分為正數的選項,項目全部保留。按照圖書館實踐、圖書館學研究和圖書館學教育三個領域分別將題目得分從高到低進行排序,橫軸為題目得分,縱軸為題目所屬領域和題目序號。圖書館實踐領域中題目9、10得分最高,對應的是圖書館用戶服務和館員綜合能力;圖書館學研究領域中題目3、5得分最高,對應的是圖書館學研究工具和圖書館學研究熱點;圖書館學教育領域中題目12得分最高,對應的是圖書館學學生綜合素質。
在專家態度評分的基礎上進一步分析,按照答案為“是”的數量將各問句從左至右順序排列,回答“是”得1分,得到重新整理的表格如下頁表5所示。經過排列,所有的結果構成了一個階梯形態,累積量表法就是利用此形態來作為判斷語句和量表的基礎。階梯形態外有兩項“否”的回答,通常采用再現系數R來計算出現的誤差是否能夠被接受,如果量表再現系數R大于0.9,就稱該量表是單維度的,每個人的態度得分就是他回答贊成的項目總數。如果R小于0.9表明量表設計欠準確。此量表的R值為0.983,設計較為準確。
4成因分析
為了對圖書館學發展產生的數據化趨勢溯源,探究圖書館學發展數據化的成因,進一步掌握和適應圖書館學發展的數據化趨勢,筆者在問卷調查的基礎上對受訪專家進行了訪談,專家的意見總體上集中在三個方面。
4.1圖書館信息資源深度開發的需要
專門法律、職業道德規范的出臺,信息通訊技術的突飛猛進,信息資源數量的激增,館舍等條件的極大改善為我國圖書館事業發展帶來了新的契機。與此同時,圖書館事業在新形勢下也面臨著很多挑戰。圖書館服務從以書為主體向以知識為主體升級;用戶的個性化、便捷化和智慧化服務需求增強;圖書館資源建設的任務發生轉變,從抓取和記錄館藏資源的描述性細節轉變為識別和構建更多資源之間的關聯。信息資源開發利用的方式一般包括“分類序化、數字化、網絡化、分析研究、知識挖掘、提供服務與進入決策”[20]。
數字化既要強調館藏資源載體的數字化轉變,也要強調對數字化文獻的重新組織并實現序化與內容的開發。但當前我國圖書館數字化實踐往往更強調前者,圖書館充斥著大量數字文獻資源,而這些資源大多停留在簡單的組織、檢索、利用層面,內容層面的開發與挖掘還未引起足夠重視。數字化改變了文獻的存取形式,并沒有實現對信息資源的深度開發。按照信息資源開發的步驟,圖書館數字化屬于“載體開發”,是基礎性開發,實現“內容開發”,需要將數據挖掘、知識組織等技術引入開發當中。
5應對策略
數據時代和數據科學帶來一系列變革,圖書館學不可能置身事外。數據化是未來圖書館學發展的新趨勢,利用數據、研究數據是圖書館學發展必須面對的問題。應對圖書館學發展的數據化,要將數據轉化成為我所用之器物,利用數據為圖書館實踐、圖書館學研究和圖書館學教育提供技術和方法的支撐。
5.1提升基于文獻內容的圖書館數據化服務
新時代圖書館用戶對知識咨詢、智庫服務、智慧服務的需求更加強烈,然而數據的數量激增,形式愈加復雜。面對繁重的數據資源,用戶自身的數據使用以及管理能力短時期內不能滿足需要,亟須專業的數據服務。數字化為圖書館數據服務提供了新的途徑,基于元數據的信息著錄、描述、檢索和保存加快了圖書館信息資源的更新與流通速度,然而由于信息單元的復雜性,許多語義關聯仍然難以發現。因此,圖書館需要深度挖掘信息資源,從數據層面揭示文獻之間隱性知識,為用戶的特定需求提供基于文獻內容的數據化服務。
部署圖書館數據化工作,需要引入數據融合技術、知識組織技術和數字人文技術,將數字文獻資源以新的方式組織、開發和可視化展示,提升圖書館對館藏數字資源內容層面的把控能力,促進圖書館信息服務向數據服務和知識服務拓展。圖書館的數據化服務中館員的意識與判斷起著全面決策的作用,圖書館實現數據化發展還要重視提升圖書館員挖掘資源與組織數據的能力,提高圖書館員的數據獲取和分析能力,成立專業的數據服務團隊,依托數據管理平臺,為用戶提供包括數據備份、信息檢索在內的專門服務;積極開展數據管理培訓,設計與科學數據管理相關的網絡指南。
5.2發展基于學科本色的圖書館學研究
圖書館學是一門發展中的科學,在發展過程中其綜合性逐漸凸顯,圖書館學與其同族學科、相關學科,甚至和大數據、數據科學等新興學科的交流更加密切,在相互影響的過程中實現跨學科發展。數據泛在的環境下,圖書館學與數據科學呈現相融合的態勢,圖書館學研究呈現出更加濃厚的數據化、智能化、知識化的發展趨勢,研究內容更加豐富,研究范式趨于數據密集化。不可否認的是數據化充實了圖書館學研究的領域,然而,科學研究范式轉變帶來的一系列數據資源獲取、組織、利用和保存的問題仍然屬于圖書情報與檔案管理學科范疇。
因此,圖書館學研究必須明確學科定位,將數據技術和數據分析方法為我所用,而不是被動驅使。圖書館學研究將人、數據和技術全面連接,需要繼承圖書館學優良的研究傳統,又要拓展圖書館學研究的新客體、新工具、新視角,提升運用數據解決更多問題、發現更多知識的能力,拓展研究的廣度和深度。圖書館學以數據為切入點取得理論創新,才是融入數據時代的有效改革,同時也不失學科本色。
6結語
本文通過分析圖書館學發展數據化的現狀和趨勢,解讀了當前圖書館實踐、圖書館學教育和圖書館學研究數據化的成因,提出了圖書館學應對數據化的策略。希望能夠拋磚引玉,引起學者們對圖書館學發展數據化的關注,并進一步論證圖書館學數據化的社會需求與發展前景。社會經濟的發展、科學技術的創新和圖書館實踐內容的豐富為圖書館學的發展固本培元。未來的圖書館學體系想必是更加符合圖書館實際需要的、研究內容更加豐富的、更能具有時代意義的。
參考文獻
[1]柯平.圖書館學科發展趨勢及未來重點領域[J].現代情報,2013,33(8):3-8.
[2]馬海群.國內圖書館學研究進展與發展動向[J].情報資料工作,2017(1):12-16.
[3]楊愛軍.論我國圖書館學層次化發展[J].圖書館,2018(3):40-43.
[4]Mayer-SchnbergerV,CukierK.BigData:ARevolutionThatWillTransformHowWeLiveWorkandThink[M].NewYork:HoughtonMifflinHarcourt,2013:15,198.
[5]趙躍.大數據時代檔案數據化的前景展望:意義與困境[J].檔案學研究,2019(5):52-60.
[6]趙思淵.地方歷史文獻的數字化、數據化與文本挖掘:以《中國地方歷史文獻數據庫》為例[J].清史研究,2016(4):26-35.
[7]張天,許靜,林超英,等.基于多維尺度法的國內學科信息服務研究熱點可視化分析[J].圖書館工作與研究,2015(8):56-60.
[8]王丹丹.數據驅動的館藏建設趨勢及實踐案例[J].情報資料工作,2016(5):74-78.
作者:金勝勇張琪
轉載請注明來自發表學術論文網:http://www.cnzjbx.cn/jylw/25646.html