本文摘要:[摘要][目的/意義]旨在分析圖書情報學科視角下數據科學教育的核心特征,有助于圖書情報學科向數據科學融入的同時把握學科自身的核心優勢,并彰顯專業及人才培養特色。[研究設計/方法]通過歸納分析,凝練了數據科學的學科內涵及其與圖書情報學科的相關關系,總結了全球
[摘要][目的/意義]旨在分析圖書情報學科視角下數據科學教育的核心特征,有助于圖書情報學科向數據科學融入的同時把握學科自身的核心優勢,并彰顯專業及人才培養特色。[研究設計/方法]通過歸納分析,凝練了數據科學的學科內涵及其與圖書情報學科的相關關系,總結了全球圖書情報學科開展數據科學教育的現狀及其核心特征。[結論/發現]數據科學與圖書情報為兩個獨立學科,但交融趨勢明顯。圖書情報學科正成為全球開展數據科學教育的重要力量;“以人為本”是圖書情報學科視角下數據科學教育的核心特征,為培養兼具創新技術方法與深厚人文關懷的數據科學人才奠定了基礎。[創新/價值]系統總結了圖書情報學科視角下數據科學教育的核心特點與優勢,為我國圖書情報學科在積極融入數據科學過程中把握自身優勢、完善數據科學教育體系、提升數據人才培養效能提供借鑒。
[關鍵詞]數據科學數據科學教育以人為本圖書情報學科展望人才培養學科交叉融合
1引言
數據已經成為繼資本、勞動力和自然資源之外的第四種生產要素[1]。以云計算、人工智能等為代表的新一代數據處理技術的興起為全球經濟保持快速增長注入核心力量,并驅動著社會變革。國務院發布的《大數據產業發展規劃(2016-2020)》指出,截至2020年,我國大數據相關產品和服務業務收入突破1萬億元,年均復合增長率保持30%左右[2]。數字經濟的飛速發展,也帶來了新興的現實世界問題。如何從存儲的海量數據中提取信息和價值成為新的全球挑戰。這直接導致從數據中挖掘價值、洞察知識的數據人才的供需缺口在持續增大。在此背景下,如何把握這一契機,發展數據能力教育、培養數據專業人才已經受到各學科領域的高度關注。
以數據驅動為主要范式,以“數據-技術-人”為組成要素[3],繼承、融合和創新了包括計算機科學、數學與統計學及信息科學等多學科在內的理論與方法,進而產生了一門新興學科———數據科學。作為現代社會研究數據理論、方法、技術、工具與實踐的新學科,數據科學學科的建設及數據人才的培養成為學術界與教育界廣泛關注的新議題,全球高校結合自身學科優勢與專長積極興辦數據科學相關教育,依托學科涉及到與數據科學密切相關的計算機科學、數學、統計學和圖書情報等多個專業,呈現出百花齊放、百家爭鳴的局面。
這其中,圖書情報學科作為研究數據管理與知識發現的重要力量,擁有挖掘數據價值的廣泛經驗與方案。因此,圖書情報學科與數據科學融合,在培養具有自身學科特色的數據人才方面具有天然的學科優勢。從全球來看,美國北卡羅來納大學教堂山分校信息與圖書館學院、伊利諾伊大學香檳分校信息科學學院及 我國武漢大學信息管理學院、北京大學信息管理系等國內外知名圖書情報院(系)都先后興辦了數據科學相關本科或研究生教育。
與教育界的快速行動相比,目前學界對數據科學專業內涵的界定與探討仍然相對滯后,這導致目前數據科學教育在培養目標、課程體系及培養方式上仍處于探索階段,存在著片面強調數據分析技術、過度依賴數據分析工具等問題。基于此,本文首先對數據科學和數據科學學科定位的相關概念與內涵進行了系統梳理,回顧了圖書情報學科數據科學教育國內外實踐現狀,闡釋圖書情報學科開展數據科學教育的核心特點與優勢,以期為我國圖書情報學科在積極融入數據科學過程中把握自身優勢、完善數據科學教育體系、提升數據人才培養效能提供借鑒。
2數據科學相關概念
2.1數據科學的內涵
在回顧數據科學教育實踐之前,首先需要明晰數據科學的概念。如前所述,先進計算技術的出現、數據的爆發式增長,使社會有能力使用新技術、新方法從海量數據中尋找解決現實世界問題的新方案,數據驅動范式由此出現[4]。為了解決大數據時代和數據驅動范式下的大數據問題,數據科學應運而生[3]。數據科學(DataScience)術語及其定義由著名計算機科學家、圖靈獎獲得者PeterNaur于1974年在其著作ConciseSurveyofComputerMethods中首次提出,他認為數據科學是一門基于數據處理的科學[5]。
隨后,數據科學經常被作為統計學的替代學科出現[6]。至1998年,Hayashi提出數據科學是包括數據設計、收集和分析在內的新的跨學科概念[7]。伴隨著數據科學研究與教育熱潮的興起,學者們從不同維度對數據科學給出了定義,但目前學界尚未有一個統一的認識。本文對其中一些概念進行了梳理!纳鲜龆嗑S度的概念可以看出,數據科學是一門具有跨學科屬性的科學,其核心問題是從數據中提取知識以獲得對問題或現象的重要見解,涉及收集、管理、分析、呈現等大數據生命周期全部方面的理論、方法和技術。
2.2數據科學與圖書情報學科的關系
從數據科學的概念與內涵不難看出,數據科學本質上是跨學科的,它的快速發展離不開計算機科學、數學、統計學及圖書情報學科的貢獻。這其中,圖書情報學科一直處于通過包容性和跨學科的教育將人們與數據、信息和技術聯系起來的前沿[16],這與數據科學的核心觀點有著天然的契合與內在聯系。隨著數據科學熱潮的不斷推進,圖書情報學科積極擁抱變化的同時需要厘清數據科學與圖書情報學科二者之間的關系,防止由于學科邊界外延而喪失學科的獨特性。
圖書情報學界就此問題多有探討。葉鷹與馬費成在2015年就通過定性及定量方法指出數據科學與信息科學在理論邏輯和技術方法上一脈相承,并揭示數據科學繼續維持了信息科學的基本原理[17]。與之相反的是,巴志超等人認為數據科學與圖書情報學科在研究對象、學科內涵、基本任務及發展目標方面都存在著較大差異,不能將數據科學看做是圖書情報學科的子集[18]。更多的觀點認為二者是互惠互利的關系,數據科學的出現為圖書情報學科研究從理論基礎、學科定位及研究范式多個層面的發展帶來了新的機遇,同樣圖書情報學科基于其深厚的理論基礎與技術實踐,從研究方法、研究范圍等方面為數據科學的發展提供了更多的可能性[19-22]。
筆者認為,數據科學與圖書情報學科的內在聯系是天然且緊密的。一方面,數據科學向基礎理論與應用領域的深化發展離不開圖書情報等學科的理論支持;另一方面,圖書情報學科在全新環境下開展數據挖掘分析、支持決策分析和知識發現與預測等,亦需要數據科學在技術方法等方面提供新的支撐。隨著數據科學的不斷演化,這種內在聯系也必將會得到進一步的強化,但這并不影響二者是兩個不同學科的本質。應當說數據科學與圖書情報學科是圍繞著一個核心原則、側重于不同應用領域的兩個獨立學科。具體來說,數據科學與圖書情報的核心原則都是對大量原始且混亂的數據及信息進行組織與處理,并將之轉化為支持決策與解決實際問題的知識。
但數據科學和圖書情報學科卻側重于不同的應用領域,圖書情報專注于信息資源全生命周期的研究與教育,主要研究網站和信息系統的應用,從而實現信息資源的采集、組織、存儲、檢索、利用和服務;數據科學則關注數據范式尤其是大數據范式下的研究與教育,側重于從數據中發現知識,主要研究大數據和機器學習等新技術新方法的應用。雖然二者在邏輯、方法和技術方面多有交叉重合,但這些方法與技術并非完全為某一學科獨有。所以數據科學與圖書情報學科是兩個存在聯系、互相交融的獨立學科。圖書情報學科在積極擁抱變化,與數據科學相互融合的同時,重視圖書情報學科的本位問題,是學科邊界外延的同時保持學科的獨特性的根本。
3圖書情報學科數據科學教育的全球實踐
3.1圖書情報學科成為全球數據科學教育的重要力量
美國北卡羅來納州立大學在2007年依托其高級數據分析研究院(InstituteforAdvancedAnalytics,IAA)設立的數據分析碩士(MasterofScienceinAnalytics)教育項目被認為是數據科學教育的起源[23]。基于強烈的數據人才的市場需求,與數據分析相關的教育項目在國外高校興起,至2013年紐約大學首次開設數據科學碩士(MasterofScienceinDataScience)教育項目,數據科學教育實現了從“數據分析”到“數據科學”的實質性轉變[24]。經過十余年的發展,國外形成了以碩士研究生(Mas-ter)教育為主,證書(Certificate)及本科(Bachelor)教育為輔,兼具博士研究生(Doctorate)教育的完善且具特色的數據科學教育體系。根據知名數據科學網絡社區DataScience.
Community①對全球數據科學院系(Datasciencecollegesanduniversity)相關統計數據顯示,截至2021年6月全球有387所院系開設了632個數據科學相關的教育項目,這些項目分布于北美洲、歐洲、亞洲、大洋洲、非洲及南美洲,項目名稱包含大數據(Bigdata)、大數據分析(Bigdataana-lytics)、數據科學(Datascience)等[25]。上述教育項目包含68個學士學位項目、437個碩士學位項目、24個博士學位項目及103個證書項目,其中碩士學位教育以69%的比例成為當前數據科學教育中最熱門的項目。
這其中,有接近1/4(155/632)的數據科學教育項目來自于全球拔尖信息學院聯盟(iSchools)成員院系,如:德雷塞爾大學計算和信息學院開設的數據科學碩士項目、北德克薩斯大學信息學院開設的數據科學碩士項目、錫拉丘茲大學信息研究學院開設的應用數據科學專業碩士項目等。這表明信息學院正成為全球開展數據科學教育的重要力量之一。與計算機、數學和統計學等專業下數據科學教育不同的是,信息學院所開設的數據科學教育大多面向不具備計算機及數學背景的學生,面向實際工作場所的應用,通過對數據驅動相關的方法、工具及理論的學習,結合理論學習與項目實訓,使學生能夠具備滿足現代就業市場需求的數據能力。
3.2國內信息管理院系向數據科學教育的積極融入
我國數據科學本科專業的建設與發展源于2016 年。2016年3月7日教育部公布《2015年度普通高等學校本科專業備案和審批結果》[26],“數據科學與大數據技術”本科專業首次被批準增設,北京大學、對外經濟貿易大學和中南大學成為3所首批設立該專業的高校,自此我國掀起了數據科學專業建設熱潮。研究生教育作為國民教育的有機組成與重要階段,是培養數據科學專門人才的重要手段。
截至2021年4月,根據中國研究生招生信息網公布的數據,包括北京大學、清華大學、武漢大學等在內的13所高校依托計算機科學與技術、統計學、數學、管理科學與工程、圖書情報與檔案管理等學科開設了數據科學、大數據科學與工程、大數據管理等碩士研究生專業17個[27]。相較于國外高校在數據科學相關專業教育的多年探索,雖然我國的數據科學教育起步較晚,但作為我國高等教育現階段的熱點問題之一,經過幾年建設也已經初步形成了數據科學本科、碩士、博士的多層次、貫通式人才培養體系。國內信息管理院系在發揮圖書情報、信息管理學科傳統優勢的基礎上,結合社會對數據科學人才現實且迫切的需求,積極融入數據科學人才培養教育體系。
2018年武漢大學信息管理學院在國內圖書情報學科率先增設了數據科學碩士和博士學位點。北京大學信息管理系、吉林大學管理學院、華中師范大學信息管理學院、天津師范大學管理學院等也先后增設“大數據管理與應用”本科專業,開啟了國內圖書情報學科培養數據科學人才的熱潮,使我國數據科學人才培養的基礎得到進一步夯實。總的來說,圖書情報學科始終致力于推進信息和數據的創建、獲取、使用與管理,與同樣以數據作為基礎資源及研究對象的數據科學,在數據收集與處理方法、分析與技術實現路徑、結果呈現可視化等方面有著天然的聯系與學科基礎。圖書情報學科在堅守學科特色的基礎上向數據科學的積極融入,為學科在大數據時代的發展提供新的機遇。
4“以人為本”的數據科學教育
4.1圖書情報學科視角下“以人為本”的數據科學的 提出及發展
盡管全球信息學院已經持續多年提供了不同層次的數據科學教育項目,并形成了一定的規模和取得了初步的成功。但是,如何更加系統、科學和高效地開展數據科學教育還仍在探索中。每個學校自身的專業布局和特殊優勢決定了其自身開展數據科學教育的具體內容與側重方向,但數據科學“數據-技術-人”的三個基本要素是不變的。尤其對于圖書情報學科而言,在積極擁抱變化向數據科學融入的同時,如何在課程設置、培養目標等方面區別于計算機科學、數據與統計學等學科開設的數據科學教育,將圖書情報學科面向用戶與數據科學面向數據的特色有效結合起來是圖書情報學科積極開展數據科學教育所必須思考的問題。
4.2圖書情報學科視角下“以人為本”的數據科學的內涵
毫無疑問,“以人為本”已經成為信息科學學界對圖書情報學科視角下數據科學教育特征的共識。以iDSCC為代表的學術組織,也正在通過對全球信息學院數據科學教育項目的分析與研究,將這一特征具象化。吳丹教授作為iDSCC的一員及數據科學專業的研究生導師,回顧目前全球圖書情報學科所開設的數據科學項目,除了統計分析、計算機編程等數據科學技術技能的必備課程外,信息倫理、信息隱私、算法公平等課程是課程體系中的一大亮點。這些課程在培養學生具備完備的數據分析技能的基礎上,重視培育學生的道德操守,重視學生的個性與創新能力在數據分析中的價值。
5結語
跨學科屬性決定了數據科學的發展離不開計算機科學、數學與統計等學科在技術與理論模型的不斷深入探索,更離不開以數據和信息為核心領域的圖書情報等人文社會科學的積極融入?梢哉f,數據賦能極大地拓寬圖書情報學科的邊界,提升了研究效率;圖書情報學科亦為數據科學注入了深厚的基礎理論方法與人文關懷。
培養同時具備強大數據分析技能與崇高社會責任感的數據科學專門人才是圖書情報學科面向國家重大戰略需求,為國育才、為黨育才的重要責任,更是在新時代把握自身發展機遇的重要手段。我們需要認識到圖書情報學科的最終歸宿是“人”,“以人為本”是圖書情報視角下的數據科學教育具有不可替代優勢的本質和根本所在,這不僅將塑造在技術方面取得進步和創新的數據科學人才,更會使我們對人性和人類價值觀理解融入到技術的進步和創新中。
作者:吳丹1,2許浩1
轉載請注明來自發表學術論文網:http://www.cnzjbx.cn/jjlw/29175.html