|
1 問題的提出和由來 科學數(shù)據(jù)是人類社會科技活動所產(chǎn)生的基本數(shù)據(jù)、資料,以及按照不同需求而系統(tǒng)加工的數(shù)據(jù)產(chǎn)品和相關(guān)信息,具有明顯的潛在價值和可開發(fā)價值,并在應用過程中得以增值, 是信息時代最基本、最活躍、影響面最寬的科技資源。 我國的國家科學數(shù)據(jù)共享工程已經(jīng)全面啟動?!?先進制造與自動化科學數(shù)據(jù)共享網(wǎng)”(項目編號:2005DK A32900)2005年正式列入國家重點科學數(shù)據(jù)共享基礎(chǔ)平臺建設(shè)計劃。檢測控制與儀器儀表作為先進制造與自動化科學技術(shù)的重要組成部分也已同步開展了本領(lǐng)域的科學數(shù)據(jù)資源整合共享研究工作,正在建設(shè)“ 檢測控制與儀器儀表科學數(shù)據(jù)共享平臺”( 以下簡稱: 儀器儀表科學數(shù)據(jù)共享平臺)。 檢測控制與儀器儀表產(chǎn)業(yè)企業(yè)眾多、產(chǎn)品更新快、用戶廣泛、技術(shù)發(fā)展迅速的特點,決定了其對科學數(shù)據(jù)和信息服務需求非常旺盛。儀器儀表科學數(shù)據(jù)共享平臺研究的目的在于:針對國內(nèi)檢測控制與儀器儀表領(lǐng)域科學數(shù)據(jù)資源短缺、凌亂、分散、共享利用率低的現(xiàn)狀, 對現(xiàn)有科學數(shù)據(jù)資源的( 進行或開展) 有效整合, 并依據(jù)發(fā)展趨勢和提升產(chǎn)業(yè)技術(shù)水平的需要,積累代表前沿和最新研究水平的科學數(shù)據(jù),實現(xiàn)檢測控制與儀器儀表科學數(shù)據(jù)的共享。 2 元數(shù)據(jù)和元數(shù)據(jù)標準 2.1 元數(shù)據(jù)的概念 元數(shù)據(jù)(M etadata)是說明數(shù)據(jù)的來源、內(nèi)容、格式、質(zhì)量、狀態(tài)及其它有關(guān)特征的信息。國際電器電子工程師協(xié)會(IE E E )將元數(shù)據(jù)定義為: “ 關(guān)于數(shù)據(jù)的數(shù)據(jù)”(dataabout data)。元數(shù)據(jù)的主要目的是促進數(shù)據(jù)規(guī)范管理,并實現(xiàn)異地、異構(gòu)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)共享:* 為數(shù)據(jù)生產(chǎn)者提供有效的數(shù)據(jù)管理和維護的手段; 通過元數(shù)據(jù)提供網(wǎng)上數(shù)據(jù)查詢、檢索與交換等。并可確保一個機構(gòu)對數(shù)據(jù)的投資,不會輕易丟失數(shù)據(jù)文檔,在出現(xiàn)數(shù)據(jù)使用爭議時也可為數(shù)據(jù)提供單位維權(quán);* 使數(shù)據(jù)的使用者快捷、全面、有效的獲取數(shù)據(jù)資源。并為潛在用戶找到其特定應用所需的數(shù)據(jù),實現(xiàn)共享,發(fā)揮數(shù)據(jù)的最大潛力。 元數(shù)據(jù)的產(chǎn)生和應用是為網(wǎng)絡信息資源的組織開發(fā)提供手段,使用元數(shù)據(jù)的目的在于使數(shù)字資源的管理維護者和使用者可通過元數(shù)據(jù)了解并辨別資源,進而管理和利用資源,為由形式管理轉(zhuǎn)向內(nèi)容管理奠定必要的基礎(chǔ),對數(shù)字對象的內(nèi)容和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎(chǔ),根據(jù)元數(shù)據(jù)包含的數(shù)字資源位置方面的信息,可以確定資源位置之所在,可促進網(wǎng)絡環(huán)境中非實體信息對象的發(fā)現(xiàn)和檢索。因此,元數(shù)據(jù)被稱為是打開多源數(shù)據(jù)資源進行智能分析、運算、挖掘知識大門的鑰匙。 2.2 元數(shù)據(jù)標準 隨著元數(shù)據(jù)理論的發(fā)展,出現(xiàn)了對數(shù)據(jù)資源整體進行描述的標準。目前流行的元數(shù)據(jù)標準和協(xié)議規(guī)范:ISO 15836:2003《信息與文獻— — 都柏林核心集元數(shù)據(jù)要素》。美國都柏林核心( Dublin Core--DC)元數(shù)據(jù)標準從1995年產(chǎn)生以來受到了全世界的廣泛承認和利用, 目前已經(jīng)被翻譯成20種語言在各國使用。都柏林核心元數(shù)據(jù)2003年正式被國際認可, 發(fā)布為ISO 15836。都柏林核心元素標準適用于各種網(wǎng)絡數(shù)據(jù)資源,它包括15個元數(shù)據(jù)核心元素,分為三個子系統(tǒng):數(shù)據(jù)資源內(nèi)容、數(shù)據(jù)知識產(chǎn)權(quán)及數(shù)據(jù)實體。 Z collection( Z 39.50 P rofile for access to th edig ital collection)是美國工會圖書館為資源集合組織、檢索開發(fā)的規(guī)范,是目前能較好描述集合、對象及其關(guān)系的元數(shù)據(jù)框架。Z collection 的特點: ① 可有效描述資源集合和資源對象之間的關(guān)系;② 可提供元數(shù)據(jù)框架體系( 抽象記錄結(jié)構(gòu)AR S); ③ 可使用Z 39.50等多個元數(shù)據(jù)檢索協(xié)議。Z collection 元數(shù)據(jù)框架能夠很好的描述資源集合、對象及其相互關(guān)系。 2.3 儀器儀表科學數(shù)據(jù)共享平臺元數(shù)據(jù)標準 儀器儀表科學數(shù)據(jù)共享平臺元數(shù)據(jù)標準是在參考國內(nèi)、國外相關(guān)元數(shù)據(jù)標準的基礎(chǔ)上,結(jié)合本領(lǐng)域科學數(shù)據(jù)的特點而制訂。采用Z collection 作為元數(shù)據(jù)標準的整體框架,標準體系分為上下二層: 結(jié)構(gòu)層和內(nèi)容層。結(jié)構(gòu)層,采用Z collection 抽象記錄結(jié)構(gòu)為基本架構(gòu),將元數(shù)據(jù)分為資源集合元數(shù)據(jù)和資源對象元數(shù)據(jù),并描述資源之間的關(guān)系。內(nèi)容層主要定義資源集合、資源對象元數(shù)據(jù)標準的內(nèi)容, 采用Dublin Core核心元素元數(shù)據(jù)標準進行描述;而資源之間關(guān)系的描述有: 父子關(guān)系、相關(guān)關(guān)系、結(jié)合關(guān)系。儀器儀表科學數(shù)據(jù)共享平臺元數(shù)據(jù)標準與“ 先進制造與自動化數(shù)據(jù)共享網(wǎng)”元數(shù)據(jù)標準保持一致。 3 儀器儀表與檢測技術(shù)數(shù)據(jù)資源體系 3.1 建立科學數(shù)據(jù)資源體系的原則 首先,數(shù)據(jù)資源體系要有一定的系統(tǒng)性和完整性,即包括從基本要素( 材料、原理)、關(guān)鍵部件( 工藝)到整體系統(tǒng)、典型案例等各個方面,形成比較系統(tǒng)的、完整的面向科研開發(fā)、行業(yè)應用的數(shù)據(jù)資源體系。其次,數(shù)據(jù)資源體系要有一定的科學性,即遵循學科或行業(yè)常規(guī)分類原則。 3.2 儀器儀表科學數(shù)據(jù)資源體系 儀器儀表與檢測科學數(shù)據(jù)資源體系的建立參考了: 自然科學技術(shù)學科分類、產(chǎn)品分類代碼、國民經(jīng)濟行業(yè)分類代碼、專利文獻分類、科技文獻分類、國家863科技計劃領(lǐng)域( 主題) 劃分等資料, 同時對本領(lǐng)域現(xiàn)有科學數(shù)據(jù)資源分布、科學技術(shù)發(fā)展熱點和趨勢等進行調(diào)研。并征詢行業(yè)內(nèi)外專家意見后,提出了儀器儀表與檢測技術(shù)領(lǐng)域科學數(shù)據(jù)資源體系。該數(shù)據(jù)資源體系包括20個技術(shù)方面,每一技術(shù)方面又可根據(jù)數(shù)據(jù)資源的情況逐級細分到最多三層,以“ 溫度測量技術(shù)及應用”為例,顯示其逐級細分到三層的體系結(jié)構(gòu), 見圖1和圖2。  
3.3 儀器儀表科學數(shù)據(jù)資源元數(shù)據(jù)表 元數(shù)據(jù)最基本的單元是元素。由于元素具有結(jié)構(gòu)簡單、通俗易懂、描述靈活等特點而被廣泛用于各領(lǐng)域的資源描述。本研究中對資源集合元數(shù)據(jù)設(shè)計了如表1中所示的元素, 對資源對象元數(shù)據(jù)設(shè)計的元素如表2所示。  
資源對象指文本、圖形、圖像、數(shù)據(jù)表格、軟件等相對獨立的數(shù)字對象, 包括的數(shù)據(jù)資源格式見表3。 
通過上述一系列基于元數(shù)據(jù)標準的設(shè)計,可以為儀器儀表與檢測技術(shù)提供關(guān)于數(shù)據(jù)資源內(nèi)容、訪問以及其它特性的描述,不僅使用戶能夠在訪問具體數(shù)據(jù)庫之前對數(shù)據(jù)是否能滿足使用要求做出判斷,而且有利于有效的數(shù)據(jù)管理和數(shù)據(jù)的長期保存。 4 基于元數(shù)據(jù)的儀器儀表數(shù)據(jù)共享平臺 儀器儀表數(shù)據(jù)共享平臺設(shè)計采用CM S( 內(nèi)容管理系統(tǒng))和SQ L S erver (數(shù)據(jù)庫管理系統(tǒng))。CM S+SQ LS erver方案主要的優(yōu)勢是充分發(fā)揮二者的長處,既利用CM S 實現(xiàn)了網(wǎng)站內(nèi)容( 數(shù)據(jù)、表格、文字、圖片等等)與網(wǎng)站組件的有機分離,方便了網(wǎng)站內(nèi)容的管理、發(fā)布和維護,而不再需要編寫大量的H T M L 代碼或手工建立每一個頁面;又充分發(fā)揮了SQ L 大型數(shù)據(jù)庫存儲數(shù)據(jù)量大、速度快、效率高、安全性好的功能, 使數(shù)據(jù)庫系統(tǒng)具備動態(tài)、高效和交互的特點。滿足了本領(lǐng)域積累的海量科學數(shù)據(jù)資源進行整合和優(yōu)化并實現(xiàn)共享服務,以利于新技術(shù)環(huán)境下對科學數(shù)據(jù)資源進行進一步的開發(fā)和利用的需要。 儀器儀表數(shù)據(jù)共享平臺首頁、數(shù)據(jù)資源體系的樹型結(jié)構(gòu)、資源集合元數(shù)據(jù)表、資源對象元數(shù)據(jù)表和具體的數(shù)據(jù)對象的實現(xiàn)形式分別見圖3、圖4、圖5、圖6。  
數(shù)據(jù)共享平臺已可提供儀器儀表國家標準和行業(yè)標準,儀器儀表產(chǎn)品分類代碼,溫度測量技術(shù)和儀表,典型自動化儀表技術(shù)性能、參數(shù)、指標等數(shù)據(jù)12萬個。另外, 網(wǎng)站的設(shè)計還包括了行業(yè)動態(tài)、科技成果、工程范例、科技論文等欄目,以期全面反映儀器儀表與檢測技術(shù)領(lǐng)域的現(xiàn)狀和發(fā)展。 摘自:中國計量測控網(wǎng)
|