<address id="vfzrl"><nobr id="vfzrl"><progress id="vfzrl"></progress></nobr></address>
    <address id="vfzrl"></address>

    <address id="vfzrl"></address>

    <em id="vfzrl"><form id="vfzrl"><nobr id="vfzrl"></nobr></form></em><address id="vfzrl"></address>
    <address id="vfzrl"></address>

    <noframes id="vfzrl"><form id="vfzrl"><th id="vfzrl"></th></form><form id="vfzrl"><th id="vfzrl"><th id="vfzrl"></th></th></form>

    國內或國外 期刊或論文

    您當前的位置:發表學術論文網經濟論文》 科學數據管理平臺“社區化”建設研究以 Digital Commons Data 為例> 正文

    科學數據管理平臺“社區化”建設研究以 Digital Commons Data 為例

    所屬分類:經濟論文 閱讀次 時間:2022-07-02 09:45

    本文摘要:摘 要:[目的 / 意義]本文 旨在研究開放式科學數據管理平臺的先進做法,為國內建設科學數據管理平臺,實現科研模式的數字化、開放化和社群化提供借鑒。[方法 / 過程]本文對國內外科學數據管理平臺的相關研究文獻進行分析,并采用探索性單案例研究法,總結知名科學數據

      摘 要:[目的 / 意義]本文 旨在研究開放式科學數據管理平臺的先進做法,為國內建設科學數據管理平臺,實現科研模式的數字化、開放化和社群化提供借鑒。[方法 / 過程]本文對國內外科學數據管理平臺的相關研究文獻進行分析,并采用探索性單案例研究法,總結知名科學數據管理平臺“DigitalCommons Data”的運營機制、建設模式及服務功能。[結果 / 結論]開放社區平臺通過數據共享和群體協作發揮科學數據的最大利用價值。以企業為主體進行市場化運作是實現科學數據管理平臺“社區化”建設的有效途徑;多領域、全球化是提高平臺開放性的關鍵所在 ; 關聯應用、定制推送是平臺專業服務的基本保障 ; 數據安全是平臺建設的重中之重。

      關鍵詞:開放科學 科學數據管理 Digital Commons Data 數據共享

    科學管理

      0 引 言

      大數據時代推動了科學研究組織范式的不斷演進,全球化趨勢下的科研合作帶來了更大范圍與更深層次的知識創造與共享,科學領域的開放程度日益提升,科學研究正由封閉模式轉向開放模式。在此背景下,美國、歐盟和日本等陸續實施了以推動“開放科學數據”為核心的“開放科學”戰略。眾多高校、科研院所等機構采取了基于建設數據共享平臺的數據驅動發展模式,掌握開放共享的主動權,以實現更高效的科研管理[1]。截至 2022 年 2 月,全球 80 多個國家和地區在國際研究數據倉儲注冊系統 re3data.org 中注冊的科學數據倉儲數量達到 3810 個,我國注冊數量為 49 個,約占 1.29%[2]。

      隨著開放科學戰略的發展,科學數據在網上進行開放共享、眾籌、眾包。OpenAIRE 的調查顯示,一種“開放身份、開放報告、開放參與、開放互動、開放預審稿、開放最終版本評論、開放平臺”的 Open Peer Review 模式成為了未來科研活動的發展趨勢[3]。這種開放參與和開放互動需要一個開放的“平臺社區”來支持科研人員進行互惠式的討論,以及數據資源的交互分享[4]。因此,科學數據管理平臺的發展趨勢也不再僅止于數據的共享與再利用,而是嘗試打造科研群組共享的“社區化”平臺,通過科研眾包和群體協作,為科研人員提供充分便利的數據共享和群體協作。本文針對“開放科學戰略下如何進行科學數據管理的社區化建設”這一問題,采用探索性單案例研究方法,以“Digital Commons Data”平臺為例總結國外科學數據管理平臺“社區化”建設模式,以期為國內科學數據管理平臺的“社區化”建設提供參考。

      1 文獻綜述

      國外啟動科學數據管理平臺建設時間較早且相對成熟,已進入快速發展階段。而國內的科學數據管理平臺目前仍處于積極建設階段,已建成的平臺主要具備數據提交、收集、組織、存儲、管理、分析、共享及發布等功能。從已發表的研究文獻來看,目前國內外關于科學數據管理平臺的研究主要集中在以下四個方面:

      (1)平臺的功能定位和特點研究。Lee J.-S 和 Jeng W 指出,美國校際社會科學數據共享聯盟存儲庫 ICPSR 是全球最大的社會科學數據基礎設施 , 存儲了超過 50 萬個文件的社科數據[5];Scot M 指出,英國數據存檔庫 UKDA 解決了諸如數據收集、存放等問題,并通過元數據制作促進了數據二次分析和定性材料的再利用[6];另外,普渡大學 PURR 平臺、Dataone 等平臺的目標均是實現科學數據的安全存儲和共享[7];項英[8]、張慧[9]、朱玲[10]以及衛軍朝[7]等分別研究了國內的科學數據管理平臺,認為武漢大學社會科學數據管理平臺、北京大學開放研究數據平臺、中國科學院科學數據管理平臺等的主要功能是實現數據的保存和管理;Steinhart G 和 DietrichD 等人研究了美國康奈爾大學 DataStaR 存儲庫在研究數據整個生命周期中的作用[11];Wilson J指出,英國牛津大學嵌入式機構數據監管服務 EIDCSR 旨在確保數據生命周期各個階段生成的研究數據可以得到安全的保存和記錄,以備未來使用[12];張計龍認為,國內部分平臺,如復旦大學社會科學數據管理平臺,也在逐步從數據的保存和共享過渡到為科研活動提供全周期服務中[13]。

      (2)平臺開發模式和技術選型研究。概括而言,國內外科學數據管理平臺的構建主要有自主開發、商業軟件購買和在成熟的開源數字資產系統上進行二次開發三種方式。如:哈佛大學自主開發了 Dataverse[14],復旦大學[13]、北京大學[15]則購買了 Dataverse 軟件作為科學數據管理基礎平臺,康奈爾大學的 DataStaR 是以自主開發的開源軟件 Fedora 作為科學數據管理基礎平臺[16],武漢大學是基于 Dspace 進行了二次開發[17],中國科學院的科學數據管理平臺則是以自主開發為主[7]。

      (3)平臺績效評估體系研究。司莉[18]和周宇[19]等人基于層次分析法構建了科學數據管理平臺的績效評估體系,主要評價指標涉及數據資源、數據管理制度、平臺功能、服務效能、平臺界面和軟件系統等;辛一研究了我國九個省份的科學數據管理平臺建設,并從網站頁面、數據資源、數據獲取、共享服務等方面構建了評價體系[20]。(4)開放科學背景下,平臺的數據共享模式研究。

      馬合等指出,從 20 世紀中葉起,美國、澳大利亞和一些歐洲國家如英法德等相繼制定了一系列科學數據管理和開放政策來推動科學數據管理的開放與共享建設[21];我國在“十四五”規劃中也提出了構建國家科研論文和科技信息高端交流平臺、建設國家數據統一共享開放平臺、保障國家數據安全[22];Wilson J[12]和 Ayris P[23]等指出英國牛津大學嵌入式機構數據監管服務 EIDCSR 以及歐洲開放科學云 EOSC 等平臺均建設了共享和開放的數據環境;LeeJ.-S 和 Jeng W 還研究了開放科學背景下 ICPSR 35 年的歸檔數據,揭示了代表數據共享趨勢的數據特征[5];Maynard M 指出 Data-PASS 采用了開放、低壁壘的合作模式且其成員能夠互補[24]。

      總體來看,國內外現有的對科學數據管理平臺的研究主要集中在平臺功能、開發模式、績效評價、數據共享模式等方面。雖然已有不少學者提到了在開放科學背景下科學數據共享的重要性和必要性,但是目前國內外科學數據共享模式的研究主要集中在如政策倡導型數據共享、開放科學電子基礎設施共享、開放共享數據環境建設以及低壁壘合作數據共享等。在實際建設中,由于數據開放共享政策不統一、不同利益相關者需求不同,目前國內外科學數據管理平臺建設仍存在數據來源單一、數據共享政策不完善、共享機制不健全、數據管理流程與規范不成熟等諸多問題。對于科學數據管理平臺,以數據管理者需求為導向,構建“社區化”合作共享機制,是推動科學數據共享的有益探索。

      目前,僅有美國地球數據觀測網 Data One Community、Dryad Community[7]和 Digital CommonsData 三個平臺建設了“開放社區”功能。這三個平臺可以分為兩種發展模式,一種以“推動平臺發展”為主,另一種以“推動數據交流”為主。兩種發展模式存在較大不同,前者面向平臺合作伙伴,后者面向所有科研人員;前者旨在推動平臺的發展,后者旨在推動科研人員的數據交流。以“推動數據交流”為主的科學數據管理“開放社區”平臺順應了科研模式的數字化、開放化和社群化要求,能夠有效地增強科研共同體建設,提升科研質量[25]。目前我國的科學數據管理平臺服務對象多局限于國內或本?蒲腥藛T,尚未形成面向全球科研人員的“社區化”平臺,因而,學習科學數據管理平臺“社區化”建設經驗對加強我國的科學數據、科研人員的交流與共享具有非常重要的現實意義。本文通過單案例研究法,對“Digital Commons Data”進行系統調研與分析,以期為推動國內科學數據管理平臺“社區化”建設提供借鑒。

      2 研究設計

      2.1 研究方法和案例選擇

      本文采用單一案例研究方法,選取具有代表性、典型性和啟發性的案例,以“增強對同類事物的理解”[26]。本文選取 Digital Commons Data 平臺作為案例研究對象,探索開放科學戰略下如何進行科學數據管理“社區化”建設。其作為科學數據管理“社區化”建設的典型代表主要體現在以下兩方面:(1)具備開放科學戰略所要求的典型功能。它是由荷蘭 Elsevier 公司自主開發的面向政府機構、高校、科研院所或企業用戶進行科學數據管理的服務平臺,既能存儲科學數據,也可以在線進行學術溝通交流,用戶還可以基于該平臺建設自己的數據一體化系統,實現數據的生產、管理、傳播和評估等功能。(2)“社區化”建設的典型性。Digital Commons Data 對接了全球超過1700 個數據存儲庫,來自世界各地的 600 多萬名研究人員在平臺上分享創意、了解領域新事物、探討領域發展動態、尋找創新研究途徑。已有文獻關于 Digital Commons Data 平臺的研究主要集中在對其閱讀指標應用的探索以及對其數據治理流程的分析,從科學數據管理平臺的“社區化建設”角度進行研究是一個全新的視角,將會帶來全新的認識。

      2.2 數據收集與分析

      在資料獲取上,本文采取了訪談和文獻資料收集相結合的方法。本文選取了荷蘭 Elsevier 上海分公司和北京分公司的 Digital Commons Data 產品負責人、開發工程師以及上海一流大學建設高校 A 大學的科研數據管理專家共 6 人作為訪談對象,以“Digital Commons Data 開放社區的運營建設模式與服務功能”為切入點,采取半結構式訪談法,同時,對訪談中遇到的相關主題進行拓展與追問。此外,從 Digital Commons Data 官網、Digital Commons Data 產品介紹、新聞報道以及相關研究成果中獲取文獻資料。通過對資料的篩選、翻譯與整合,建立能夠相對全面描繪 Digital Commons Data 平臺運營與服務機制的案例資料庫。在對訪談記錄進行整理時,本文采取了三級編碼的方式。一級編碼是開放式編碼,基于前期廣泛收集的原始數據資料,經過編碼與整合 , 提煉概括了 28 個概念化類屬(A1-A28)。二級編碼是主軸式編碼,在一級編碼的基礎上,對形成的 28 個概念化類屬進行對比和歸納,總結出 8 個范疇化類屬(B1-B8)。三級編碼是選擇式編碼,在二級編碼的基礎上,建立各范疇之間的聯系,形成 3 個核心類屬(C1-C3)。

      3 案例描述與分析

      3.1 Digital Commons Data 開放社區的運營機制Digital Commons Data 平臺的建設理念在于實現科學數據的充分利用(A3),幫助用戶對科學數據進行全生命周期管理(A4),使科研人員能夠隨時隨地、安全地訪問和共享信息(A6、A7)。另外,Digital Commons Data 旨在實現科學數據在科研群組內的共享,通過打造公共群組,提供相同領域研究人員相互聯系的專用空間,契合科研合作網絡生態。Digital Commons Data 產品研究和開發的資金主要來自 Elsevier 公司這一市場化主體的自主投入(A8),高校、科研院所、政府單位等若要使用該平臺,需要進行服務購買(A9)。

      3.2 Digital Commons Data 開放社區的建設模式Digital Commons Data 平臺在技術框架上基于云端進行分布式部署(A10)和模塊化應用(A11),既可以靈活組合也可以與其他科學數據管理(RDM)工具結合使用(A12、A13)。平臺對外提供開放式應用程序接口(API)(A14),可以與全球科學數據管理生態系統和其他 Elsevier科研情報管理系統集成使用。另外,Digital Commons Data 整合了 Elsevier 投稿系統,科研人員在使用 Digital Commons Data 投稿的同時可以提交研究過程中的數據集。

      3.3 Digital Commons Data 開放社區的服務功能

      3.3.1 全球科學數據庫索引Digital Commons Data 收錄了全球 1700 多個公共數據存儲庫中約 2050 萬個數據集(A15),每個數據集均有超過 100GB 的存儲空間,科研人員可以發布、共享、展示和存儲科研數據。平臺對其中 35 個存儲庫的 1000 多萬個數據集進行了深度索引(A16),支持多維度檢索,并提供數據文件內容的在線預覽,不僅使得科研人員能夠輕松準確地找到相關數據,同時也顯著提高了科研項目的可見度和影響力。

      3.3.2 電子實驗室記錄本作為一個安全的云存儲庫,可以在平臺長期存儲科學數據,無論用戶在哪里,數據都很容易被共享、訪問和使用,獨立科研人員或團體可以在同一位置組織、批注和共享數據,有效提升了科研人員的工作效率。同時,先進的電子實驗室記錄本功能(A18),可以存儲、采集、重現不同版本的科學數據(A19),以支持縱向研究,還可向各級組織提交一鍵生成的數據報告(A20)。獨特的 DOI 使得用戶的研究成果與引用數據集實現關聯(A17)。

      3.3.3 科研形象管理和社交網絡用戶科研形象的個性化管理是 Digital Commons Data 平臺的主要特色之一,通過狀態查詢,用戶可以查看個人研究成果的影響力、所在國家、研究領域等[27],還可以與平臺上志同道合的科研人員進行聯系,進一步拓展自己的學術研究網絡。另外,Digital Commons Data 可以設置不同用戶群組,并給予不同權限,用戶可閱讀、修改組內所有文獻。此外,“Feed”功能可以跟蹤用戶的研究主題與社交網絡,并進行相關研究及新研究人員推薦(A24)。

      3.3.4 招聘就業與基金資助信息服務

      作為一個學術網絡的社交平臺,借助龐大的用戶體量和科研領域的專業服務,Digital CommonsData 面向機構和用戶提供雙向招聘就業服務。截至 2022 年 2 月,平臺已發布 262361 個科學、技術和衛生工作的就業崗位(A26),用戶可根據地區或領域進行搜索(A27)。同時,Digital Commons Data能夠從 2000 多個機構及時收集到基金資助信息,幫助科研人員快速匹配適合申請的基金項目(A28)。

      4 結論與啟示

      4.1 市場化運作模式是實現平臺建設的有效途徑Digital Commons Data 平臺是由 Elsevier 公司自主開發并管理的,政府、高校、科研機構或其他企業可通過購買服務的方式使用該平臺。我國目前的科學數據管理平臺多集中于科研院所和高等院校,往往基于自身研究需求而建,數據孤島的現象普遍存在,開放共享的意識也還沒有形成。“開放社區”的本質是推進科學數據共享,推動科研人員群體協作,借鑒 Digital CommonsData 平臺的運營模式,推進以科研人員需求為導向、以企業為建設主體的科學數據管理平臺建設,是實現“開放社區”理念和打造優質服務功能的重要途徑。

      4.2 多領域、全球化是提高平臺開放性的關鍵所在Digital Commons Data 平臺擁有全球 600 多萬名科研用戶,用戶數量多且覆蓋領域廣,全球化的數據共享基本能滿足各個領域研究人員的科研需求。有學者研究指出,Digital Commons Data 的訪問量與傳統被引量呈正向強相關關系,說明越來越多的研究人員選擇在 Digital Commons Data上閱讀和整理文獻,進而進行引用[28]。目前我國自建的科學數據管理平臺多集中于某一單一領域,與全球科學數據平臺的鏈接也比較少,因此打造多領域、全球化的科學數據管理平臺,對提升用戶覆蓋范圍、融入全球科學研究生態體系、提高平臺影響力具有深遠的意義。

      4.3 關聯應用、定制推送是平臺專業服務的基本保障Digital Commons Data 平臺提供各類數據應用、分析軟件工具及不同版本的應用下載和插件說明,為用戶提供一站式的數據存儲、分析和應用服務。同時,平臺還能定制推送關注領域的發展動態,體現了數據共享的拓展形式。我國的科學數據管理平臺多以存儲功能為主,對于平臺的可持續發展、功能模塊、用戶體驗等方面考慮較少,在數據密集型科學及科學研究第四范式的推動下,以關聯應用和智能推送為主要服務模式的平臺建設,是科學數據管理平臺提高用戶科研效率、提升科研合作的關鍵。

      4.4 數據安全是平臺建設的重中之重科學數據是科技創新與發展的基礎性戰略資源,科學數據安全的影響大至國家安全、產業安全,小至個人的合法權益。Digital Commons Data 可自建群組,將共享數據的權限限制在組內成員之間,大大保障了數據共享過程中的安全性問題 (A25)。我國科學數據管理平臺也要將數據存儲、傳輸、共享過程中的安全問題作為重中之重,在數據脫敏、權限控制、系統 監控等各個方面健全制度和流程,做好軟硬件保障,保護科學數據在其全生命周期中免受破壞性外力和非授權操作的侵害 , 保持科學數據的機密性、完整性和可用性。本文雖然對 Digital Commons Data 這一平臺進行了較為全面的調查分析,但限于篇幅,未能對其他具有代表性的科學數據管理平臺進行調查和比較研究,因而所得出的經驗啟示不夠全面。隨著科學數據管理平臺“開放社區”建設的蓬勃發展,未來將有更多的案例值得進一步挖掘與探索,也可以從技術和結構等更多維度上進行拓展。

      【參考文獻】

      [1]顧立平 . 科研模式變革中的數據管理服務 : 實現開放獲取、開放數據、開放科學的途徑[J]. 中國圖書館學報 ,2018,44(6):43-58.

      [2]re3data.org[EB/OL].[2022-02-14].

      [3]Ross-Hellauer T, Deppe A , Schmidt B. Survey on open peer review: Attitudes and experience amongst editors,authors and reviewers [J]. Plos One, 2017, 12(12):e0189311.

      [4]嚴煒煒 , 張敏 . 科研協同中的數據共享與利用行為模式分析[J]. 情報理論與實踐 ,2018,41(1):55-60.

      [5]Lee J.-S, Jeng W. The landscape of archived studies in a social science data infrastructure: Investigating the ICPSRmetadata records [J].Proceedings of the Association for Information Science and Technology.2019,56(1):147-156.

      [6]Scot M. Les archives britanniques des sciences sociales. Deux études de cas: UK Data Archive (UKDA) etQualidata[J]. Genèses, 2006, 63(2):46-65.

      [7]衛軍朝 , 張春芳 . 國內外科學數據管理平臺比較研究[J]. 圖書情報知識 ,2017(5):97-107.

      [8]項英 , 賴劍菲 , 丁寧 . 高校圖書館科學數據管理服務實踐探索——以武漢大學社會科學數據管理為例[J].情報理論與實踐 ,2013,36(12):89-93.

      選自期刊《文獻與數據學報》第 4 卷 第 2 期

      作者信息:王 茜 王 晨(上海市研發公共服務平臺管理中心,上海 200235)

    轉載請注明來自發表學術論文網:http://www.cnzjbx.cn/jjlw/30386.html

    五级黄18以上免费看