時間:2021-03-19
摘要
隨著新興產業的高速發展,企業需要盡快針對新興產業開展研發工作,因而產生了大量的新技術,對此,具有知識產權意識的公司需針對新興技術進行專利挖掘和布局,以應對未來可能出現的知識產權糾紛,為公司的產品保駕護航。而為了高效、高質的完成專利挖掘,如何跨領域的將數據庫理論應用于專利挖掘,也是近來大家考慮的一個方向。
關鍵詞:專利挖掘、新技術、數據庫理論。
正文
專利挖掘工作是企業進行專利布局及實施專利管理工作的基礎,為此,如何在專利挖掘中使用有效的挖掘方法,是助力企業專利挖掘工作的一個利器。專利挖掘工作中,如何確定待挖掘的數據源是一個關鍵的部分,即從何種對象入手實施專利挖掘是達成專利挖掘的項目目標的一個關鍵,通常情況下,企業會考慮主要基于如下幾類數據源來規劃挖掘工作。
1、基于企業產品來挖掘某一技術領域的專利;
2、基于某一類技術現有的專利來挖掘外圍專利;
3、基于單一競爭對手的專利來有針對性的實施專利挖掘;
4、針對一類產品挖掘其在某一技術領域的標準專利。
此處需要注意到的是,在上述挖掘工作中,都同時面臨如何管理好待挖掘的數據源的問題,是否可以找到一種可靠的數據管理模型來提供高效的數據管理方式。
在此,我們先引入一個在計算機的數據挖掘領域廣泛使用的概念“數據存儲庫”(例如數據倉庫),數據挖掘可以應用于任何類型的數據存儲庫,一般情況下,數據存儲庫可以包括如下幾種類型:數據倉庫、關系數據庫、事物數據庫、萬維網、一般文件和數據流等,而本文將重點關注數據倉庫。所謂數據倉庫,是一種具有收集并組織多維度數據的信息存儲庫,基于這種特性,考慮將其作為本文將要討論的一種應用于專利挖掘工作中的數據管理模型。
下面就針對基于企業產品來挖掘某一技術領域的專利挖掘工作,以自主研發技術而聞名的A企業為例,討論一下在專利挖掘過中如何應用數據倉庫這種數據管理模型,使得專利挖掘工作更簡單,挖掘結果更準確。
假設A企業是一個成功的跨國公司,我們當前的任務是挖掘該公司每種產品在人工智能領域的專利,A公司產品部門分布全球,涉及的產品線多達幾十個,且每個產品線在人工智能領域都有完善的自主開發的技術集,目前該企業計劃布局每個產品在人工智能領域的專利。
分析可知,A公司產品線多,從數據管理的角度來看,每個產品在人工智能領域開發的技術方案相對分散,散布在多個開發部門的開發組中實現,因此,在專利挖掘過程中,將考慮如何高效的無遺漏的挖掘并管理來自不同開發組開發的專利方案。圖1示出了一種數據倉庫構造和使用的典型系統框架,經過研究,可以考慮將圖1所示的數據倉庫的結構模型應用在該專利挖掘項目中,以實現高效、高質量的完成專利挖掘目標。
數據倉庫的核心是多維數據庫結構建模,該模型實現了一種典型的物理結構,即多維數據立方體(multidimensional data cube),數據立方體可以提供數據的多維視圖,每個維對應于模式中的一個或一組屬性,好處是可以快速查詢到匯總數據。
針對A公司的專利挖掘項目,在待挖掘的數據源是各個產品中人工智能領域的技術內容的情況下,可以利用上述多維數據立方體構建一種可靠的數據管理模型。如圖2所示,在此項目中,多維數據立方體中的三個維度可以定義為:產品(電視、音響、電飯煲、冰箱等)、人工智能技術(圖像識別、語義分析、信息檢索、深度學習)和產品的應用場景(物聯網、智能家居、導航、客服等),即本次項目的挖掘工作可以采用上述模型所限定的三個維度元素進行組合遍歷,該多維數據立方體中的每個單元存儲挖掘到的專利的技術方案。例如圖2中所示出的,在物聯網場景下同圖像識別相關的家用電視的專利技術方案內容為S4,存放在單元<電視,圖像識別、物聯網>中,而其他立方體單元中可以存放遍歷其他幾個維度組合上挖掘到的技術方案。
下面就基于上述數據管理模型,簡述A公司產品在人工智能領域的專利挖掘過程和挖掘結果。
1.1 產品維度
分析A公司的產品系列,可以綜合考慮產品的重要度、成熟度等幾個方向綜合確定產品的專利挖掘方向和重點。
在產品重要度的分類中,可以考慮將產品按照重點產品和非重點產品劃分,分別估算重點產品和非重點產品能產出的專利量。需要說明的是重點產品具有如下一個或多個屬性:市場占有率和增長率高、技術含量高、銷售利潤高等。
在產品成熟度的分類中,可以考慮將產品按照市場應用和技術實現的成熟性進行劃分,重點估算成熟度高的產品的專利量。需要說明的是高成熟度的產品包括如下一個或多個屬性:涉及前沿的實現完善的成熟技術、用戶反饋良好的方向等。
另外關于新產品,需要根據情況部署關鍵技術的專利。
1.2 人工智能技術維度
針對人工智能技術所涉及的如圖3所示的多個分支技術,結合已經確定的產品挖掘方向,實現在深度、廣度兩個維度上分別進行縱向布局和橫向布局。
人工智能技術的分支技術的分類如下圖3所示:
關于縱向布局的挖掘結構中,主要是實現基于每一類分支技術開展縱向布局,可以圍繞某一類或某一個分支技術在延續、縱向這個維度上進行的改進和迭代,形成縱向布局結構。
上述采用延續、縱向的布局方式,主要基于技術是不斷更新發展的特性來確定,隨著技術的不斷發展,必然產生迭代的技術改進點,因此,縱向布局結構主要跟隨的是技術的更迭而產生。
關于橫向布局的挖掘結構中,主要是實現基于不同類型技術的關聯因素開展的橫向布局,既可以圍繞不同技術之間的關聯關系,形成橫向布局結構。
采用不同技術之間的關系支持的布局方式,主要基于各類技術都處于相關技術群中,任何一項技術都不是孤立的發展,隨著相關技術群以及技術群與技術群之間的關聯日益密切,必然產生關聯技術之間的創新點,因此,橫向結構布局主要是基于相關技術之間的關系因素為支撐點。
1.3 應用場景維度
基于本文所討論的專利挖掘方法,將最后一個挖掘維度—應用場景與上述兩個維度的挖掘方向進行結合,最終實現多維數據立方體在專利挖掘項目中的有效應用。
基于本文討論的多類產品和人工智能技術,當前可以涉及到的應用場景的類型大致如下圖4所示:
圖4
對于圖4中羅列的應用場景,可以結合1.2中完成的技術布局結構,實現在網狀結構上進行網狀式布局。
技術總是從已知領域滲透至未知領域,并且隨著產品種類的增長,技術及技術之間更迭也是迭代發展,導致了技術在不同領域應用時會產生意想不到的新用途,從而可以蔓延出覆蓋型的網狀布局結構,這種網狀布局結構可以理解為產品的實現技術應用在各個應用場景下所形成的枝蔓結構。
由此可知,基于1.1、1.2和1.3,我們可以完成A公司產品中關于人工智能專利的自主布局和挖掘工作,進一步的,在產品后續的更新迭代過程中,仍舊可以采用上述挖掘方式,作為繼續專利進行申請。
此處需要說明的是,在A企業部署外圍專利、規避性專利和標準專利的過程中,同樣可以考慮使用本文涉及到的數據管理模型,來開展和規劃專利挖掘工作。
總結
專利挖掘的過程是一個反復循環的過程,每一個挖掘步驟如果沒有達到預期目標,都可以回到前面的步驟,重新調整并執行專利挖掘。本文提供的關于數據倉庫的數據管理模型,為整個挖掘過程提供了一個可回溯的技術支持,即在專利挖掘的過程中,如果需要回溯調整之前的挖掘步驟,這種數據管理模型具有易查詢、易追溯、易替換的優點,真正做到為企業的專利挖掘項目提供有效、高效的工具。
參考文獻
[1] 馬天旗,專利挖掘,2016年9月.
[2] 馬天旗,專利布局,2016年9月.
[3] Jiawei Han, Mlceline Kamber,Jian Pei, Data Mining, 北京;北京機械工業出版社.
[4] 范晴,孟小峰,數據挖掘概念與技術, 北京;北京機械工業出版社..