云計算助推知識產權信息化服務水平
[ 導讀 ] 湯森路透德溫特世界專利索引(Derwent World Patents Index)的報告稱,到2015年,來自中國的專利申請數量預計將達到近50萬件,緊隨其后的是美國和日本,分別將達到40萬件和大約30萬件。
湯森路透的數據顯示,2006年至2010年,來自中國專利辦公室的申請數量從17.1萬件增至近31.4萬件,平均每年增長16.7%。
在此期間,日本的國際專利申請量居世界第一,之后依次為美國、中國、韓國和歐洲。
在中國提交所有的專利申請中,國內申請所占比例從2006年的不到52%升至2010年的近73%,說明中國企業在專利高潮中已超過了外國企業。
根據世界知識產權辦公室(WIPO)的數據,中國企業提交的海外專利申請數量也在不斷增加。
2010年,中國第二大電信設備制造商中興通訊(ZTE)的國際專利申請量居世界第二,僅次于日本的松下公司。
美國芯片制造商高通公司(QCOM)排名第三,中國華為技術有限公司排名第四。
由此可見,專利信息數據量與日俱增,從幾千萬到幾個億,其中中文專利就有300多萬件,數據空間容量幾百GB;系統對檢索性能要求高,在數百并發請求的壓力下要求95%的檢索在1秒內完成,98%的檢索請求在3秒內完成響應;數據結構復雜,包含著錄項、代碼化全文數據XML等,同時有些專利還附有圖形說明書,包括TIFF圖、PDF文件,物化視圖和虛擬庫勢力,包括和虛擬庫實例;排序結果智能處理要求高,要求查準和接近100%查全、豐富的概覽和詳覽展示、檢索結果分類統計等。
長期以來,對于海量專利數據的處理一直為國外企業所壟斷,如美國湯姆森科技,韓國WIPS等跨國集團。為了貫徹我國知識產權戰略,擺脫長期依賴國外專利技術系統的局面,實現專利檢索和分析系統的自主建設和自主發展,我國在知識產權保護和管理方面正在積極發展與探索著,但同時也面臨著十分嚴峻的挑戰。
我國在知識產權信息化服務中,對于專利數據的挖掘分析涉及到海量文本挖掘、信息檢索、信息可視化等技術的通常做法是:采用文本挖掘對海量專利文本進行信息的抽取;采用語義檢索篩選專利;采用信息可視化技術對分析結果進行輸出。這些環節需要大量的數學運算,屬于典型的計算密集型業務,只有通過高性能計算集群才能保證任務的完成周期。關鍵問題包括:如何利用現有的先進技術,組織和管理中國專利文獻,如何為專利審查員和專利申請人提供高效、快捷的專利文獻全文檢索和分析機制。
專利信息量的迅速增長以及查詢的復雜化,使傳統的分析檢索系統已不能滿足對數據進行深層次多維度分析的要求,因此需要建設能夠處理海量非結構化信息的、高度智能化的專利分析解決方案,通過對專利信息進行多維分析處理,從而將分析結果以多維視圖的方[FS:PAGE]式展現給決策者。
云計算高速并行的計算能力為我國知識產權信息化服務機構提供了新的契機。它將幫助這些服務機構建立基于多種索引模式和知識詞典的全文檢索、提供自然語言檢索和相似性檢索、專利群族等全方位智能檢索,甚至可以提供更多更精確的分類檢索、表格檢索、表達式檢索、英文詞根檢索、跨語言的專利查詢、專利文獻的復雜單元(化學表達式和數學表達式)檢索,各項檢索都支持二次檢索、同義詞檢索等,并可以將檢索結果作為檢索歷史保留,等等。
云計算的第一要素是信息。信息技術的發展,是一個從信息匾乏到信息無處不在的過程,我們經歷了以系統為中心的集中處理階段,以PC為中心的分布處理階段,以網絡為中心的信息分享階段,到現在能隨時隨地存取的云計算階段。面對云計算對信息收集、處理產生的巨大影響,知識產權信息服務機構需要對云計算創新服務模式進行嘗試,直到完全適應,并發揮更大效能。
1、基于云計算的數據組織、管理方式。
不斷增長的海量數據,只有被充分組織、管理和利用才能發揮其真正的價值。在傳統的網絡環境下,信息資源的組織方式一般分為四種方式:即文件方式、數據庫方式、主題樹方式、超媒體方式。而文件方式本身可看作信息單元,需要作為對象來管理,所以很難在網絡信息載體中廣泛被使用,但運用云計算,用戶數據都存儲于服務器中,軟硬件服務也都由云提供,這樣對于存儲于網絡中的用戶個人數據,或部分用戶數據,使用這種簡單方便的存儲非結構化信息的天然單位的文件方式存儲數據,是最優的解決方案。這也會帶動目前普遍的數據庫方式改革以克服其不能提供數據信息之間的知識關聯和對用戶和數據庫服務端要求較高的缺點。
2、實現基于云計算的知識產權檢索、分析的系統布署。
由于用戶的信息需求千差萬別,并且隨時間的變化而動態變化,向用戶提供滿意的知識產權信息服務是很不容易的。為此,在信息服務活動中需要遵循針對性原則、及時性原則、易用性原則一、成本效益原則。對于云計算來說,深層次信息服務也是其最終目的。在云環境下,需要基于工程文獻基礎數據,綜合云的特征,高效開展集成檢索、定題服務、情報分析、決策參考等深度服務。
著名的穆爾斯(Mooers)定律:一個情報檢索系統如果對用戶來說,取得情報比不取得情報更傷腦筋和麻煩的話,用戶就會傾向于不使用該系統。Dialog信息檢索服務的名譽主席RogerK.Summit則以另一種方式對此進行了表述:“穆爾斯定律告[FS:PAGE]訴我們信息的使用與獲得信息的容易程度成正比。”信息用戶總是希望信息系統越便于使用越好,越是簡便易用的信息系統,用戶使用的頻率也越高。反之,則很少有用戶去使用。云服務由于整合了大量的一手的用戶的數據和信息,使得用戶通過非正規渠道查找所需要的信息比以往更加便利。
檢索系統的好壞、使用是否方便,不僅要看系統本身能否實現用戶的預期目的,另一個關鍵在于系統的硬件部署是否可以滿足大數據量訪問的要求。
基于云計算的知識產權檢索、分析系統,其優越在于:
(1)更低成本
傳統的存儲均采用SAN和NAS結構,尤其是SAN,硬件設備相對昂貴的多,而云存儲系統中不僅采用廉價的大容量存儲服務節點和網絡設備構成存儲平臺,而且通過系統軟件實現統一管理和容錯機制,就可以提供高效、穩定服務,在同樣容量和性能的條件下,可以將系統構建成本節省5-10倍以上,并且規模越大,價格優勢越明顯。
(2)優異性能
可以支持高并發、帶寬飽和利用,數據在多個節點上并行讀寫,服務器自動均衡負載,系統性能隨節點數增加而線性增長,性能與節點規模成正比,沒有性能瓶頸,可提供2GB/s以上的單點訪問性能。
(3)高度可靠
元數據服務器主備雙機鏡像熱備份,主元數據服務器宕機后,備元數據服務器能自動接替主元數據服務器工作,且不丟失數據;操作日志本地持久化保存;塊位置副本信息分布在塊數據服務器上,啟動注冊時生成。元數據日志多機冷備份,防止主備元數據服務器同時損毀的情況;可根據元數據日志恢復元數據。
采用高可靠的冗余編解碼機制,支持多重數據保護,根據數據需求可靈活設置備份方式(如8+2方式、4+2方式),自動屏蔽故障,提供24×30×365小時不間斷存儲服務;任意節點出現故障,系統將會自動根據節點情況,依據編解碼方案恢復原數據。這樣,在節點發生故障的情況下,也可以實現數據的無間斷服務。
(4)無限容量
可支撐的容量接近無限,理論容量為1024×1024×1024PB(1G個PB容量);
(5)在線伸縮
在不停止服務的情況下,根據存儲容量的需求,動態加入新的存儲節點,無需任何操作,即實現系統容量從TB級平滑擴展到PB級,能夠根據客戶端的數目動態的提高存儲系統的訪問性能要求。
國內已有企業研究出了完美實現以上所有性能的超低功耗PB云存儲系統,不僅使系統超高密度和超低功耗得到優化,而且采用了冗余備份機制,保障用戶數據的[FS:PAGE]安全可靠性,更智能便捷的使用模式將極大程度的滿足用戶的數據訪問、存儲、處理要求,恰恰滿足知識產權信息利用的大數據處理要求。
云計算作為新興產業浪潮的重要驅動力,必將在發展進程中對我國經濟和社會產業廣泛深遠的影響。通過高效處理海量數據的機制,推動中國信息化建設進程,提高資源利用率,減少人力資源浪費和能源功耗。基于云計算的知識產權信息服務的研究,將打破長期以來依賴國外專利技術系統的局面,為實現專利檢索和分析系統的自主建設和自主發展,提供更廣闊的思路和發展空間。
關于云創存儲:
云計算領先企業,專業從事云存儲、云處理產品研發、銷售與服務。公司針對大數據存儲、處理、視頻內容識別和遠程傳輸,研發了領先的cStor云存儲、cProc云處理、cVideo視頻和cTrans云傳輸技術,可廣泛應用于電信、智慧交通、智能安防、智慧醫療等領域。云創存儲目標是成為國際上最大的云存儲產品供應商。
在此期間,日本的國際專利申請量居世界第一,之后依次為美國、中國、韓國和歐洲。
在中國提交所有的專利申請中,國內申請所占比例從2006年的不到52%升至2010年的近73%,說明中國企業在專利高潮中已超過了外國企業。
根據世界知識產權辦公室(WIPO)的數據,中國企業提交的海外專利申請數量也在不斷增加。
2010年,中國第二大電信設備制造商中興通訊(ZTE)的國際專利申請量居世界第二,僅次于日本的松下公司。
美國芯片制造商高通公司(QCOM)排名第三,中國華為技術有限公司排名第四。
由此可見,專利信息數據量與日俱增,從幾千萬到幾個億,其中中文專利就有300多萬件,數據空間容量幾百GB;系統對檢索性能要求高,在數百并發請求的壓力下要求95%的檢索在1秒內完成,98%的檢索請求在3秒內完成響應;數據結構復雜,包含著錄項、代碼化全文數據XML等,同時有些專利還附有圖形說明書,包括TIFF圖、PDF文件,物化視圖和虛擬庫勢力,包括和虛擬庫實例;排序結果智能處理要求高,要求查準和接近100%查全、豐富的概覽和詳覽展示、檢索結果分類統計等。
長期以來,對于海量專利數據的處理一直為國外企業所壟斷,如美國湯姆森科技,韓國WIPS等跨國集團。為了貫徹我國知識產權戰略,擺脫長期依賴國外專利技術系統的局面,實現專利檢索和分析系統的自主建設和自主發展,我國在知識產權保護和管理方面正在積極發展與探索著,但同時也面臨著十分嚴峻的挑戰。
我國在知識產權信息化服務中,對于專利數據的挖掘分析涉及到海量文本挖掘、信息檢索、信息可視化等技術的通常做法是:采用文本挖掘對海量專利文本進行信息的抽取;采用語義檢索篩選專利;采用信息可視化技術對分析結果進行輸出。這些環節需要大量的數學運算,屬于典型的計算密集型業務,只有通過高性能計算集群才能保證任務的完成周期。關鍵問題包括:如何利用現有的先進技術,組織和管理中國專利文獻,如何為專利審查員和專利申請人提供高效、快捷的專利文獻全文檢索和分析機制。
專利信息量的迅速增長以及查詢的復雜化,使傳統的分析檢索系統已不能滿足對數據進行深層次多維度分析的要求,因此需要建設能夠處理海量非結構化信息的、高度智能化的專利分析解決方案,通過對專利信息進行多維分析處理,從而將分析結果以多維視圖的方[FS:PAGE]式展現給決策者。
云計算高速并行的計算能力為我國知識產權信息化服務機構提供了新的契機。它將幫助這些服務機構建立基于多種索引模式和知識詞典的全文檢索、提供自然語言檢索和相似性檢索、專利群族等全方位智能檢索,甚至可以提供更多更精確的分類檢索、表格檢索、表達式檢索、英文詞根檢索、跨語言的專利查詢、專利文獻的復雜單元(化學表達式和數學表達式)檢索,各項檢索都支持二次檢索、同義詞檢索等,并可以將檢索結果作為檢索歷史保留,等等。
云計算的第一要素是信息。信息技術的發展,是一個從信息匾乏到信息無處不在的過程,我們經歷了以系統為中心的集中處理階段,以PC為中心的分布處理階段,以網絡為中心的信息分享階段,到現在能隨時隨地存取的云計算階段。面對云計算對信息收集、處理產生的巨大影響,知識產權信息服務機構需要對云計算創新服務模式進行嘗試,直到完全適應,并發揮更大效能。
1、基于云計算的數據組織、管理方式。
不斷增長的海量數據,只有被充分組織、管理和利用才能發揮其真正的價值。在傳統的網絡環境下,信息資源的組織方式一般分為四種方式:即文件方式、數據庫方式、主題樹方式、超媒體方式。而文件方式本身可看作信息單元,需要作為對象來管理,所以很難在網絡信息載體中廣泛被使用,但運用云計算,用戶數據都存儲于服務器中,軟硬件服務也都由云提供,這樣對于存儲于網絡中的用戶個人數據,或部分用戶數據,使用這種簡單方便的存儲非結構化信息的天然單位的文件方式存儲數據,是最優的解決方案。這也會帶動目前普遍的數據庫方式改革以克服其不能提供數據信息之間的知識關聯和對用戶和數據庫服務端要求較高的缺點。
2、實現基于云計算的知識產權檢索、分析的系統布署。
由于用戶的信息需求千差萬別,并且隨時間的變化而動態變化,向用戶提供滿意的知識產權信息服務是很不容易的。為此,在信息服務活動中需要遵循針對性原則、及時性原則、易用性原則一、成本效益原則。對于云計算來說,深層次信息服務也是其最終目的。在云環境下,需要基于工程文獻基礎數據,綜合云的特征,高效開展集成檢索、定題服務、情報分析、決策參考等深度服務。
著名的穆爾斯(Mooers)定律:一個情報檢索系統如果對用戶來說,取得情報比不取得情報更傷腦筋和麻煩的話,用戶就會傾向于不使用該系統。Dialog信息檢索服務的名譽主席RogerK.Summit則以另一種方式對此進行了表述:“穆爾斯定律告[FS:PAGE]訴我們信息的使用與獲得信息的容易程度成正比。”信息用戶總是希望信息系統越便于使用越好,越是簡便易用的信息系統,用戶使用的頻率也越高。反之,則很少有用戶去使用。云服務由于整合了大量的一手的用戶的數據和信息,使得用戶通過非正規渠道查找所需要的信息比以往更加便利。
檢索系統的好壞、使用是否方便,不僅要看系統本身能否實現用戶的預期目的,另一個關鍵在于系統的硬件部署是否可以滿足大數據量訪問的要求。
基于云計算的知識產權檢索、分析系統,其優越在于:
(1)更低成本
傳統的存儲均采用SAN和NAS結構,尤其是SAN,硬件設備相對昂貴的多,而云存儲系統中不僅采用廉價的大容量存儲服務節點和網絡設備構成存儲平臺,而且通過系統軟件實現統一管理和容錯機制,就可以提供高效、穩定服務,在同樣容量和性能的條件下,可以將系統構建成本節省5-10倍以上,并且規模越大,價格優勢越明顯。
(2)優異性能
可以支持高并發、帶寬飽和利用,數據在多個節點上并行讀寫,服務器自動均衡負載,系統性能隨節點數增加而線性增長,性能與節點規模成正比,沒有性能瓶頸,可提供2GB/s以上的單點訪問性能。
(3)高度可靠
元數據服務器主備雙機鏡像熱備份,主元數據服務器宕機后,備元數據服務器能自動接替主元數據服務器工作,且不丟失數據;操作日志本地持久化保存;塊位置副本信息分布在塊數據服務器上,啟動注冊時生成。元數據日志多機冷備份,防止主備元數據服務器同時損毀的情況;可根據元數據日志恢復元數據。
采用高可靠的冗余編解碼機制,支持多重數據保護,根據數據需求可靈活設置備份方式(如8+2方式、4+2方式),自動屏蔽故障,提供24×30×365小時不間斷存儲服務;任意節點出現故障,系統將會自動根據節點情況,依據編解碼方案恢復原數據。這樣,在節點發生故障的情況下,也可以實現數據的無間斷服務。
(4)無限容量
可支撐的容量接近無限,理論容量為1024×1024×1024PB(1G個PB容量);
(5)在線伸縮
在不停止服務的情況下,根據存儲容量的需求,動態加入新的存儲節點,無需任何操作,即實現系統容量從TB級平滑擴展到PB級,能夠根據客戶端的數目動態的提高存儲系統的訪問性能要求。
國內已有企業研究出了完美實現以上所有性能的超低功耗PB云存儲系統,不僅使系統超高密度和超低功耗得到優化,而且采用了冗余備份機制,保障用戶數據的[FS:PAGE]安全可靠性,更智能便捷的使用模式將極大程度的滿足用戶的數據訪問、存儲、處理要求,恰恰滿足知識產權信息利用的大數據處理要求。
云計算作為新興產業浪潮的重要驅動力,必將在發展進程中對我國經濟和社會產業廣泛深遠的影響。通過高效處理海量數據的機制,推動中國信息化建設進程,提高資源利用率,減少人力資源浪費和能源功耗。基于云計算的知識產權信息服務的研究,將打破長期以來依賴國外專利技術系統的局面,為實現專利檢索和分析系統的自主建設和自主發展,提供更廣闊的思路和發展空間。
關于云創存儲:
云計算領先企業,專業從事云存儲、云處理產品研發、銷售與服務。公司針對大數據存儲、處理、視頻內容識別和遠程傳輸,研發了領先的cStor云存儲、cProc云處理、cVideo視頻和cTrans云傳輸技術,可廣泛應用于電信、智慧交通、智能安防、智慧醫療等領域。云創存儲目標是成為國際上最大的云存儲產品供應商。
【聲明】物流產品網轉載本文目的在于傳遞信息,并不代表贊同其觀點或對真實性負責,物流產品網倡導尊重與保護知識產權。如發現文章存在版權問題,煩請聯系小編電話:010-82387008,我們將及時進行處理。
相關文章
信息化建設融入西部開發
西部大開發10周年之際,又值第十四屆西洽會,西部地區的經濟、民生和社會信息化發展成為社會各界關注點。日前召開的國務院常務會議強調,今后10年,必須以增強西部地區自我發展能力為主線,以保障和改善民生為核心,以科技進步和人才開發為...
04月22日 14:36通信信息報
云計算的未來是什么?
一場突如其來的疫情使得很多人不得不宅在家里,這場疫情之中,很多線下實體店遭受了巨大的沖擊,但是很多互聯網企業卻在這次疫情之中賺的盆滿缽滿。我們可以發現由于無法在辦公室辦公和會議,很多公司開始了遠程辦公和遠程會議;由于醫院人...
04月21日 12:21 CSDN
如何選擇云計算物聯網平臺
企業的云計算物聯網平臺必須監視物聯網端點和事件流,分析邊緣計算和云平臺中的數據,并啟用應用程序開發和部署。物聯網(IoT)是當前計算世界中最熱門的概念之一。云計算物聯網平臺甚至可能在宣傳和炒作規模上超過物聯網。但是,這兩者...
05月27日 12:18機房360
云計算工作負載需要哪些保護
組織出于各種原因采用多個云平臺,例如提高效率和分配計算資源。根據《2021年Flexera云現狀報告》,92%的企業采用了多云戰略,80%的企業采用了混合云戰略。但這些企業也經常經歷管理復雜性的增加,這會影響安全性并增加風險。...
08月12日 15:34360機房
云計算專家如何彌補網絡安全技能差距
導讀:網絡安全技能的差距如今仍然是一個現實問題,但最終可能會解決。根據(ISC)2公司發布的2020年網絡安全勞動力的研究報告,網絡安全技能差距正在縮小。網絡安全技能的差距如今仍然是一個現實問題,但最終可能會解決。根據(ISC...
03月10日 09:56企業網D1Net