【專利布局分析大解密】EP7─篩選/分類-詞庫?AI?不如協作平台

【專利布局分析大解密】EP7─篩選/分類-詞庫?AI?不如協作平台

我們在上一集介紹到了使用高效的協作平台,不僅可以多人同步分工,也能提升分類品質。
現在市面上很多產品號稱有AI功能及技術同義詞庫、甚至可以改寫摘要索引,協助使用者輕鬆執行篩選/分類工作。甘安捏?科技日新月異,為什麼目前還是沒辦法呼叫小精靈,一鍵直接把400篇專利分類完?
不囉嗦,讓我們繼續看下去~

  1. 一般泛用字詞庫僅適合專利檢索
  2. 篩選/分類時需要自建專用字詞庫
  3. AI技術限制,要應用於專利分析仍言之過早
  4. 專利改寫內容不夠深入,無法協助專利閱讀
  5. TIPS AA級驗證要求執行專利布局分析

一般泛用字詞庫僅適合專利檢索

我們在專利篩選跟分類的階段是屬於痛苦的工作階段,市面上有很多的產品堅稱透過AI或是技術詞庫是可以來輔助我們的工作效率的。
我們先從詞庫來開始談。
一個主題的技術詞庫如果可以幫助我們一開始就可以建立技術的同義字詞庫,它確實是非常有幫助的。
像國內呢就有一些機構有建立一些常用的這個技術字詞庫。
包含像國家教育研究院、經濟部智慧財產局,它們都有建立像雙語詞彙、或者是專利技術名詞的中英文對照資料庫。
那我們就可以藉由這邊來做查詢。
有時候我們也可以用Google 來去查同義詞彙,那其實也可以幫我們查詢技術的一些同義字詞。
那還有一些商用資料庫,像新穎公司的IPTECH,就可以像畫面上這樣,查詢”color filter”我們就可以看到它可以有彩色濾光器、彩色濾光片還有彩色濾光鏡這些同義詞,可以讓我們去找到技術的這個中英文對照用語的正確翻譯。
那還有一些台灣跟兩岸大陸的這個用語的差異性,甚至還有一些專利技術文件裡面常用的名詞,我們也可以透過這樣的方式來去找到。
讓我們在檢索的時候就可以快速的去下正確的檢索條件來找到正確的專利。
雖然呢 它因為都是比較偏泛用性,不能盡善盡美,但是其實還是可以幫我們減省一些調查的時間。

篩選/分類時需要自建專用字詞庫

上述這些詞庫都是蒐集比較廣泛性的技術用語,那實際上當我們在進行篩選跟分類階段的時候,這時候我們其實要更聚焦在這個專利技術的實施手段。
這些技術詞語可能有一些是詞庫找不到的。
甚至在不同技術領域,它可能會用到同樣的技術名稱這個縮寫,所以我們一定要仔細去確認。
舉例來說,像GaN小寫的a,在半導體領域呢它代表的是氮化鎵的分子式;
但GAN大寫的A,它剛好是人工智慧AI技術裡面一個很重要技術,叫”生成對抗網路”的縮寫。
所以我們在篩選分類的時候,因為這個詞庫裡面不會特別去提到,所以我們就要留意而且區分是不是這個特殊用語、跟我們的技術領域是否有相關。
再加上詞庫通常都不會提到功效用語,所以我們配合的專家自己本身在看專利的時候,也會順便去留意還有保存這些功效的一些詞庫。
也就是說一般的平台所提供的詞庫,比較屬於一般性的字詞,可以輔助我們檢索使用。
但建議在篩選跟分類的階段,主要還是希望使用者能夠自建自己的詞庫。
畢竟既然都花時間看專利了,大家當然會希望這些知識可以累積到下一次分析來使用。
所以每讀一件專利,就順便去建立不同技術的用語。
其中也可以包含功效的一些用語並建立字詞庫。
甚至我們還可以用不同的這個顏色來去做標示跟表現,來引導我去強化我在專利閱讀的效率,在重點的掌握上才可以更快。
舉例來講像上次提到這個彩色濾光片,我們上次有提到如果它應用在LCD跟應用在這個顯示器上面,就跟我們要讀的這個彩色濾光片是無關的,我們就可以把LCD跟顯示器標示成紅色;
如果這個技術有提到Micro lens或是微透鏡,那就跟我們要讀的其實是有高度相關,我們就可以把它標示成藍色;
那如果是應用領域我們就會用黃色,像CCD跟CMOS我們就可以把它標示成是黃色;
那功效分類我們就可以用綠色來標示。
所以像畫面上可以看到的畫質的提升,它其實就是代表提升解析度,在閱讀的時候就會發現它標示成綠色,我們就會知道這個區塊就是跟功效有關,那我就會很直覺地透過顏色來去做一個提示。
所以如果整篇專利看到都是紅紅的,我就會知道這個跟我要看的無關,我就可以略過不看。
那相反的如果它是有藍色也有黃色,我就會知道跟我的技術高度相關,我就可以再細部去閱讀,這樣其實又直覺又不傷眼力。

我們的顧問團隊,只要有一個顧問把這個詞庫建好,再去分享給其他顧問使用,大家互通有無其實這個分享詞庫就會很快建立起這個分析案的專用字詞庫。
驗證了知識來自於團體的力量。
所以在自建詞庫的過程之中,同時針對詞庫進行多元性的技術分類,更透過顏色來加註各個技術的詞性,這是顧問專家給我們的寶貴經驗分享。
所以總結來說,關於一般常聽到的平台累積的技術詞庫能提升我們使用的品質,這句話應該僅限於檢索的利用而已。
所以像前面提到的像TIPO的這個檢索字詞庫,它只能做檢索的輔助。
當我們要細部的進入到篩選跟分類階段的時候,因為我們還是要針對目前的分析標的,所以我們會建議顧問團隊們還是要自行去建立自己的專屬詞庫。

至於使用者該如何自建自己的詞庫呢?首先平台要可以提供關鍵字詞的標示功能。
沒有的話也沒關係,現在有一些瀏覽器的外掛程式小工具的Plug-in,它可以建立不同技術主題的字詞庫。
如果你已經是我們新穎公司IPTECH的平台用戶,也想要進一步了解這個資訊,可以找我們的業務同仁去取得進一步的資訊哦!

AI技術限制,要應用於專利分析仍言之過早

現在大家言必稱AI,畢竟是時代的潮流,事實上新穎公司利用AI來輔助來做閱讀已經研究加實作超過17年了。
我們應該可以很客觀來分享我們利用AI在專利分析的一些經驗。
我們之前有提到專利除了是技術文件同時也是法律文件,所以專利申請人為了擴大它的專利申請範圍會改寫專利名稱。
所以像之前我們提到「一個可承載液體的容器」,我們人類就可以很直覺的認知它在講的其實是水杯。
可以對於AI機器,你如果要它去理解,它其實就需要花費大量的算力 還有前後文來去學習。
所以我會認為短時間如果你要讓AI來幫助我們人類去讀懂這篇專利甚至做到分類,可能還需要很長的一段路。
而且這個成本可能比現在人類還要貴。
但是初步透過AI幫我們排序關聯度、優先序、或是挑出常用關鍵字,我想還是有一定的幫助的。
為什麼AI技術發展已經非常成熟了,但應用在專利上還是讓人這麼不放心呢?
我們新穎公司之前也投入全球的AI技術的專利分析,我們的技術總監有跟我們分享,現在AI技術比較成熟的部分是在圖像的處理上面。
像前面提到的GAN生成對抗網路,它就是用在Deep Fake變臉技術上面。
你要讓AI分析的好,首先要讓AI先閱讀大量的大數據資料,讓它去學習資料的特徵。
比方說你要讓AI去知道甚麼叫做眼睛、鼻子原來長得像這個樣子、它的特徵是什麼。
那AI就可以透過它的這個學習經驗去模擬出一張真的臉出來。
那如果資料量不夠多的時候,當然現在也有發展出少量學習的演算法。
方式就是藉由少量的樣本讓AI去學習特徵,現在最廣泛的應用就是在醫學圖像的判讀上。
舉例來說,我們可以把有腫瘤的這個核磁共振圖像讓AI去學特徵。
再把所有病人的核磁共振影像提供給AI,讓AI去挑出有相同特徵的圖,就可以幫醫生來找出高度疑似病例。
這些都是圖像的處理分析為主。

可是如果是在文字或是文章的閱讀上面,AI最新的這個演算法採用的是LSTM(Long short-term memory),也就是長短期記憶模型。
這個AI技術它其實就是模擬人類在閱讀文章的時候,我們會透過文章的前後文來去理解這個文章的內容。
可是現在這個技術它還是需要大量的這個學習樣本才能夠增加準確度。
對於專利來說,因為我們所研究或是感興趣的這些專利文章,它都是屬於比較前沿型的或是最新的專利技術,樣本還不足,所以專利文章的數量可能還不到上千件,這個數量其實對AI來講學習的數量是不夠多的。
所以它很難去建立技術特徵。
再加上這個專利用語,每一篇專利都不一樣,所以如果你要用AI來幫我們分類,就可想而知不太OK。
甚至有些領域我們用IPC分析還更準確。
但是我們還是持續的不斷的去投入研究要怎麼去改善AI分析的準確度,我們花了很多的算力跟時間,而這個成本又會是另外一個問題了。
我們之前跑一個禮拜的AI分析,就付了大約五萬塊給Google。
所以我們也還在建立自己的AI引擎,繼續突破當中。
我想新穎公司在利用AI在專利分析上面,應該是屬於這個走在最前端的先驅了。

我們之前也跟其他研究機構合作專利分析案,對方有先提供給我們國際知名的專利平台工具所產生的專利報告。
進一步去解讀發現,它所提供的這個AI專利地圖,怎麼前面提到這個專利的技術發展國家是美國、可是後面在分析專利件數最多的公司又說是Samsung,啊Samsung不是韓國公司嗎?
看得我們黑人問號。
然後還有包含它在介紹各公司主流技術的時候,舉例來講它就告訴我們主要公司是Qualcomm,Qualcomm主要的技術是發展在processors上面,還有像information processing、跟intelligent computing上面。
都是在講運算處理processing,可是真實它應用在甚麼樣的情境、在甚麼樣的領域上面,其實真的是有看沒有懂…
我們再細部的去閱讀會發現,AI所挑選出來的專利好像跟我們要研究的這個技術核心不太相關。
我們就請專家幫忙詳讀,發現專家建議保留的這個命中核心的專利其實正確率不到20%。
所以其實等於你花錢買了一份昂貴可是參考性不高的這個報告,我們建議還不如好好掌握檢索條件,可能效果會更好。

像我們以前服務過的日本公司或是日本技研單位,他們實際在專利檢索上是很紮實的用大量的關鍵字去配合檢索語法,一步一腳印的去做好檢索工作的,也不是使用AI的分析的成果。
他們組合出來的檢索條件可能就佔了一到兩頁,其實這都是常見的事。
我們現在分析案所使用的手法,也比較類似日本的技研單位所使用的方式,AI大概就是目前是做輔助參考使用。
不過因為AI還是未來的一個趨勢,我相信技術日新月異,總有一天我們人類會突破這個瓶頸。
新穎公司已經累積20年操弄全球專利資料庫的格式跟資料的經驗,對於專利資料它不同國家不同年代各個資料欄位的定義,其實我們都瞭若指掌。
那我們也相信AI演算法的特性跟優缺點我們都已經深入研究過一輪,相信不久的將來我們應該就可以用AI來輔助我們去做專利的篩選跟專利的分類。
這個技術我們還在持續發展中。
相信有一天AI能夠真正去解決現在高級的「工人智慧」,讓機器可以透過類人工的方式,來輔助我們的客戶做閱讀跟自動分類。
目前我們其實已經有一些初步的雛型了,那後續如果有最新成果,我們也會再跟大家分享。

專利改寫內容不夠深入,無法協助專利閱讀

國際上也有其它的系統號稱說透過專利改寫的特殊功能,能夠輔助專利的篩選跟分類的作業。
這些改寫的這個專利當然對於檢索上可以發揮一定的一個幫助,可是這個改寫它其實只有針對摘要,對我們實際在做篩選跟分類上面其實還算是比較粗糙。
像我們剛前面提到的,每一篇文章都在講processor跟information processing,都講得一模一樣,專家看完心理不禁OS:啊是在哈囉嗎?
改寫的深入度不夠,這些關鍵字其實上跟專家要分析的技術是絕對不一樣的。
改寫過的專利其實只有針對簡單的摘要,專家鑑定跟這個改寫解讀出來的結果可能其實也是不太一樣。
簡單來說就是改寫人沒有你專業啦!
所以這個不見得會對專利分析會有實質幫助,當然參考性也會有限。
還有一個重點就是現在的審查專利都要求專利文件的撰寫風格,專利文件大部分都已經被要求要明確去寫出實際的實施內容跟手段還有它的應用範圍,所以在易讀性上面跟10年前已經大不相同了。
那內容非常清楚的時候,我們認為一般技術人員大概都可以很輕鬆的去理解了。

我想專利篩選分類工作確實需要非常謹慎有效率的作業方法跟平台,尤其分析者對於自己分析的技術標的要能夠夠清楚,才能夠有機會產出高質化的分析報告。
如果仰賴市場上的技術改寫詞來進行分類的依據,這確實都僅僅只是參考的使用,不可能做為很好的分析結果。
最後還是要建議你,先制定一個協同的作業環境跟機制,由大團隊一起來遵循執行,這樣對於公司在長期推動新創技術的專利布局分析將會是一個比較好又具有品質的解決方案。

TIPS AA級驗證要求執行專利布局分析

因為最近很夯的這個ESG智財驗證的取得,如果已經取得ESG智財驗證的一個要件,那就表示你已經取得TIPS的A級驗證。
那當然就會進一步地想要再繼續挑戰AA級驗證。
那根據這個TIPS的這個驗證判定基準,在裡面有一個AA的題型是必要要做的事情,就是定期進行產業智財法律事件的監控還有影響的評估。
我想我們還是會建議各公司都應該要盡早投入專利布局分析工作。
你如果要參與ESG的整個報告裡頭,智財的制度管理政策有關於AA等級你專利布局分析,肯定是你必要實施的政策跟方向。

下集主要將探討:專利的章節架構固定,比文獻期刊更具有規則性,想讀懂專利其實一點都不難。
也歡迎來我們的官網部落格看看,了解更多針對企業應該如何做專利布局,專家顧問的看法。

若是有其他針對專利布局分析想了解的題目或疑問,也歡迎在底下發問。