TWI595371B - 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 - Google Patents
法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 Download PDFInfo
- Publication number
- TWI595371B TWI595371B TW105142810A TW105142810A TWI595371B TW I595371 B TWI595371 B TW I595371B TW 105142810 A TW105142810 A TW 105142810A TW 105142810 A TW105142810 A TW 105142810A TW I595371 B TWI595371 B TW I595371B
- Authority
- TW
- Taiwan
- Prior art keywords
- legal
- candidate
- search
- legal data
- keyword
- Prior art date
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本案係關於一種資料搜尋系統及搜尋處理方法,尤指一種以單一欄位進行關鍵字組的關聯度搜尋及排序之法學資料搜尋系統、搜尋處理方法及其電腦可讀取紀錄媒體。
一般而言,法學資料的範疇主要包含審判相關法規、判解函釋、判決書、法律案件、除權判決公告等,並可依據欲查詢的法學資料的範疇,透過一法學資料搜尋系統進行法學資料查詢,例如司法院法學資料檢索系統(查詢網址:http://jirs.judicial.gov.tw/Index.htm)。使用習知的法學資料搜尋系統時,通常需先確定欲查詢的範疇,例如查詢法規或判決書,於點選進入頁面後即可進行法規或判決書之查詢。
第1圖為習知之法學資料搜尋系統使用介面之示意圖。如第1圖所示,如欲利用傳統的法學資料搜尋系統使用介面1進行判決書查詢,使用者必須先確認欲查詢的裁判字號、年分、法院層級和地區,並依照法學資料搜尋系統使用介面1顯示的法院名稱、裁判類別、判決字號、判決案由、判決日期、裁判主文及全文檢索語詞等欄位10輸入對應屬性的關鍵字,於執行檢索後才能找到相應的法學資料。然而,傳統的
法學資料搜尋系統僅能搜尋出完全吻合該關鍵字的資料,而上述的判決字號、法院層級和地區等關鍵字資訊對於使用者而言不易取得且不易了解其語法,因此常於輸入關鍵字進行檢索後得到「查無資料」之檢索結果,換言之,傳統的法學資料搜尋系統不只操作複雜,且無法搜尋提供與關鍵字具有關聯度之相關法學資料。
舉例而言,當欲搜尋案由為「侵害專利權有關財產權」時,若於判決案由欄位輸入「專利侵權」則無法搜索出任何資料。當欲搜尋裁判字號為「六十三年度上易字第六十一號」時,若於判決字號欄位輸入「63年度上易字第61號」則無法找到任何資料。再者,前述之案例中,若搜尋之法院輸入錯誤,仍無法找到任何法學資料。由於所輸入的關鍵字必須精準吻合法學資料的內容才能夠搜索到該筆法學資料,容易導致無法檢索到欲查詢的法學資料,且無法檢索到具相關聯性的法學資料,造成檢索的不便,且檢索過程繁瑣耗時,無法提供使用者友善的操作體驗。
此外,習知的法學資料搜尋系統所搜尋的結果清單係以日期作為順序排列的依據,然其並無法依據判決書與關鍵字的關聯性進行排序,因此搜尋結果排序較前面的判決書往往不會是最具關聯性的判決書,使搜尋的精準度低落,造成使用者需大量閱讀與過濾,徒費檢索與閱覽的時間。此外,除判決書查詢之外,審判相關法規檢索、判解函釋檢索、法律案件檢索或除權判決公告檢索等亦存在相同的問題。整體而言,傳統的法學資料搜尋系統的檢索精準度低落,檢索過程繁瑣費時且不便利。
有鑑於此,實有必要發展一種法學資料搜尋系統及搜尋處理方法,以解決現有技術所面臨之問題。
本案之目的在於提供一種法學資料搜尋系統及搜尋處理方法,其可提供與關鍵字具關聯性的相關法學資料,提高檢索的精確度,提供友善且易於操作的使用者體驗,並且可以節省使用者檢索與閱覽的時間。
為達上述目的,本案之一較廣義實施樣態為提供一種法學資料搜尋系統,包含:法學資料庫,儲存複數筆法學資料;用戶端裝置,包括智能檢索介面,其中智能檢索介面係供使用者輸入關鍵字組;以及檢索伺服器,與法學資料庫及用戶端裝置相連結及通訊,且包括處理器,其中處理器依據用戶端裝置之關鍵字組進行法學資料搜索作業,處理器包括:關鍵字標記與選擇性擴展模組,將關鍵字組之一個或複數個關鍵字句進行標記作業以及選擇性地進行擴展作業,以取得複數個候選關鍵字句,其中每一個候選關鍵字句分別帶有一標記,且標記係與候選關鍵字句之類別相關聯;關鍵字搜尋欄位與權重調配模組,依據複數個候選關鍵字句與所屬之標記選定各候選關鍵字句之對應搜尋欄位以及對應加權參數;搜尋及關聯度分數計算模組,依據複數個候選關鍵字句搜尋法學資料庫之複數筆法學資料,以取得複數筆候選法學資料,並對複數筆法學資料進行各筆候選法學資料之關聯度分數計算;以及排序模組,依據複數筆候選法學資料之關聯度分數進行關聯度排序作業,俾提供經關聯度排序之複數筆候選法學資料至使用者裝置。
為達上述目的,本案之另一較廣義實施樣態為提供一種法學資料搜尋處理方法,用於法學資料搜尋系統以進行法學資料檢索作業,其中法學資料搜尋系統包括檢索伺服器,檢索伺服器包括處理器架構於執行法學資料檢索作業,法學資料搜尋處理方法包括步驟:(a)接收關鍵字組,對關鍵字組之一或複數個關鍵字句進行標記作業以及選擇性地進
行擴展作業,以取得複數個候選關鍵字句,其中每一個候選關鍵字句分別帶有標記,且標記係與候選關鍵字句之類別相關聯;(b)依據複數個候選關鍵字句與所屬之標記選定各候選關鍵字句之對應搜尋欄位以及對應加權參數;(c)依據複數個候選關鍵字句搜尋法學資料庫之複數筆法學資料,以取得複數筆候選法學資料,並對複數筆法學資料進行各筆候選法學資料之關聯度分數計算;以及(d)依據複數筆候選法學資料之關聯度分數進行關聯度排序作業,俾提供經關聯度排序之複數筆候選法學資料。
為達上述目的,本案之再一較廣義實施樣態為提供一種法學資料搜尋處理方法,用於一法學資料搜尋系統以進行法學資料搜尋作業,其中該法學資料搜尋系統包括檢索伺服器,檢索伺服器包括處理器架構於執行法學資料搜尋作業,法學資料搜尋處理方法包括步驟:(a)接收一關鍵字組,對關鍵字組之一或複數個關鍵字句進行擴展作業,以取得複數個候選關鍵字句;以及(b)依據複數個候選關鍵字句搜尋法學資料庫之複數筆法學資料,以取得與關鍵字組具關聯性之複數筆候選法學資料。
為達上述目的,本案之又一較廣義實施樣態為提供一種電腦可讀取記憶媒體,其係儲存程式,且於法學資料搜尋系統之檢索伺服器載入並執行程式後,檢索伺服器係執行如前所述之法學資料搜尋處理方法。
1‧‧‧法學資料搜尋系統使用介面
10‧‧‧欄位
2‧‧‧法學資料搜尋系統
21‧‧‧檢索伺服器
200‧‧‧主機
210‧‧‧處理器
211‧‧‧存儲器
2111‧‧‧程式
2112‧‧‧擴展詞庫
2113‧‧‧類別-搜尋欄位-權重對應資料庫
2114‧‧‧權重參數資料庫
212‧‧‧通訊單元
213‧‧‧輸入輸出單元
214‧‧‧關鍵字標記與選擇性擴展模組
216‧‧‧關鍵字搜尋欄位與權重調配模組
217‧‧‧搜尋及關聯度分數計算模組
218‧‧‧排序模組
219‧‧‧資料輸出模組
219a‧‧‧高亮標示單元
219b‧‧‧內容擷取單元
22‧‧‧法學資料庫
221‧‧‧法學資料
222‧‧‧資料欄位
23‧‧‧使用者裝置
23a‧‧‧智慧型手機
23b‧‧‧平板電腦
23c‧‧‧筆記型電腦
23d‧‧‧桌上型電腦
231‧‧‧智能檢索介面
232‧‧‧搜尋欄位
233‧‧‧搜尋按鍵
234‧‧‧排序切換按鍵
S10~S15‧‧‧法學資料搜尋系統之搜尋處理方法之步驟
S21~S23‧‧‧關聯度分數計算方法之步驟
第1圖為習知之法學資料搜尋系統使用介面之示意圖。
第2A圖為本案較佳實施例之法學資料搜尋系統之一示範例之架構示意圖。
第2B圖為本案較佳實施例之法學資料搜尋系統之另一示範例之架構示意圖。
第3圖為第2A圖之使用者裝置之智能檢索介面之示意圖。
第4圖為第2A圖之檢索伺服器之架構示意圖。
第5圖為第2A圖之法學資料庫之示意圖。
第6圖為第4圖之檢索伺服器的處理器與存儲器之架構示意圖。
第7圖為本案較佳實施例之法學資料搜尋系統之搜尋處理方法之流程圖。
第8圖為第2A圖之使用者裝置顯示法學資料檢索結果之示意圖。
第9圖為本案較佳實施例之關聯度分數計算方法之流程圖。
體現本案特徵與優點的一些典型實施例將在後段的說明中詳細敘述。應理解的是本案能夠在不同的態樣上具有各種的變化,其皆不脫離本案的範圍,且其中的說明及圖式在本質上係當作說明之用,而非架構於限制本案。
第2A圖為本案較佳實施例之法學資料搜尋系統之一示範例之架構示意圖,第2B圖為本案較佳實施例之法學資料搜尋系統之另一示範例之架構示意圖,第3圖為第2A圖之使用者裝置之智能檢索介面之示意圖,第4圖為第2A圖之檢索伺服器之架構示意圖,以及第5圖為第2A圖之法學資料庫之示意圖。如第2A、2B、3、4及5圖所示,本案之法學資料搜尋系統2包含檢索伺服器21、法學資料庫22以及至少一個使用者裝置23。於一實施例中,如第2A圖所示,檢索伺服器21與法學資料庫22可共同設置於一主機200,並透過主機200內之連接埠等本機裝置相連結與通訊。於另一實施例中,如第2B圖所示,檢索伺服器21與法學資料庫22可為獨立且分離之實體裝置,並透過通訊網路20
相連結與通訊。檢索伺服器21以及該至少一個使用者裝置23係藉由通訊網路20相連結與通訊,其中通訊網路20可為例如但不限於網際網路、行動通訊網路等。使用者裝置23包括但不限於具聯網功能之智慧型手機23a、平板電腦23b、筆記型電腦23c或桌上型電腦23d。使用者裝置23經由通訊網路20與檢索伺服器21相連結,並載入與顯示一智能檢索介面231,以供使用者輸入關鍵字組以及啟動檢索作業。如第3圖所示,於本實施例中,該智能檢索介面231包括單一之搜尋欄位232及搜尋按鍵233,其中搜尋欄位232用以供使用者輸入欲搜尋之法學資料之關鍵字組,搜尋按鍵233係供使用者點擊以依據輸入於搜尋欄位232之關鍵字組啟動檢索作業。如第5圖所示,法學資料庫22包括複數筆法學資料221,其中每一筆法學資料221包括複數個資料欄位222。如第4圖所示,檢索伺服器21包括處理器210、存儲器211、通訊單元212以及輸入輸出單元213。處理器210係架構於執行檢索作業以及管控檢索伺服器21。存儲器211係架構於儲存程式及儲存執行檢索作業所需之預存資料。通訊單元212係架構於與使用者裝置23以及法學資料庫22相連結與通訊。輸入輸出單元213係架構於進行指令與資料的輸入與輸出。
第6圖為第4圖之檢索伺服器的處理器與存儲器之架構示意圖,以及第7圖為本案較佳實施例之法學資料搜尋系統之搜尋處理方法之流程圖。如第2A至7圖所示,於本實施例中,檢索伺服器21之處理器210包括關鍵字標記與選擇性擴展模組214、關鍵字搜尋欄位與權重調配模組216、搜尋及關聯度分數計算模組217、排序模組218以及資料輸出模組219。檢索伺服器21之存儲器211包括程式2111、擴展詞庫2112、類別-搜尋欄位-權重對應資料庫2113以及權重參數資料庫2114。本案之法學資料搜尋系統2及其搜尋處理方法說明如下。首先,如步驟S10
所示,檢索伺服器21之處理器210於接收到源自使用者裝置23之關鍵字組及啟動檢索作業要求時,解析該關鍵字組並開始執行法學資料搜尋作業。舉例而言,若所輸入的關鍵字組為「訴字第一四四二號 台南地院」時,檢索伺服器21之處理器210係將該關鍵字組解析且擷取為包含複數個關鍵字句,如「訴字第一四四二號」、「台南地院」等關鍵字句。
接著,如步驟S11所示,處理器210係執行該關鍵字標記與選擇性擴展模組214,以將關鍵字組之各關鍵字句進行標記作業,俾使各關鍵字句成為帶有標記之候選關鍵字句。於本步驟中,標記作業可包括例如但不限於對各候選關鍵字句係歸屬於法院名稱、判決字號或法規等類別給予標記,換言之,各候選關鍵字句所帶有之標記係與該候選關鍵字句之類別相關。於本步驟中,處理器210更可選擇性地對關鍵字組之各關鍵字句進行擴展作業,其中選擇性係指處理器210對關鍵字組之各關鍵字句進行擴展作業或不進行擴展作業。前述擴展作業可包括例如但不限於同義字詞擴展、數字轉國字擴展、國字轉數字擴展、法規名稱擴展、法規條號擴展、案件性質擴展、案號辨識與擴展以及法院辨識與擴展,藉此以取得經擴展之複數個關鍵字句。於一些實施例中,處理器210可先進行擴展作業,將關鍵字組之關鍵字句擴展,以取得經擴展後之複數個關鍵字句,之後,處理器210再進行標記作業,將經擴展後之複數個關鍵字句成為分別帶有標記之複數個候選關鍵字句。舉例而言,上述關鍵字組之一關鍵字句「訴字第一四四二號」擴展為「訴字第一四四二號」、「訴字第1442號」等關鍵字句並將其標記為「判決字號」而成為帶有標記之候選關鍵字句,且將上述關鍵字組之另一關鍵字句「台南地院」擴展為「台南地院」、「台南地方法院」、「臺南法院」、「臺南地方法院」等關鍵字句並將其標記為「法
院名稱」而成為帶有標記之候選關鍵字句。於另一些實施例中,處理器210可先進行標記作業,使關鍵字組之各關鍵字句分別帶有標記,之後,處理器210再進行擴展作業,以將帶有標記之關鍵字句擴展,藉此取得複數個帶有標記之候選關鍵字句。
於一些實施例中,存儲器211之擴展詞庫2112中可先預存擴展作業之擴展關鍵字句,因此該關鍵字標記與選擇性擴展模組214於執行擴展作業時,可於存儲器211之擴展詞庫2112中取得對應的擴展關鍵字句。應強調的是,本步驟之標記與選擇性擴展作業並不以上述實施例為限,且可依據實際應用需求而任施變化,藉此以增加關鍵字組搜尋範圍的廣度,並達到以關聯性進行檢索之功效。於本實施例中,法學資料之類別可包括例如但不限於法院名稱、刑事判決、民事判決、行政判決、判決字號、判決案由、判決日期、裁判主文、法規名稱或法規內文。由於各候選關鍵字句所帶有之標記係與該候選關鍵字句之類別相關,因此依據個候選關鍵字句之標記即可判斷取得該候選關鍵字句所屬之類別。
之後,如步驟S12所示,於完成標記作業後,處理器210係執行該關鍵字搜尋欄位與權重調配模組216,以依據上述複數個候選關鍵字句及其各自所屬之類別,對每一個候選關鍵字句進行搜尋欄位與權重調整與分配作業。舉例而言,上述的候選關鍵字句「訴字第一四四二號」依據其標記可知所屬類別為「判決字號」,於執行搜尋欄位與權重調整與分配作業後,可依據候選關鍵字句及其所屬類別,設定該組候選關鍵字句欲於法學資料庫22中進行檢索的資料欄位可涵括例如但不限於法學資料221的「判決字號」以及「判決主文」等資料欄位(請參閱第5圖),藉此可擴展關鍵字之檢索廣度。此外,並依據該類別及/或欄位之重要程度,給定一對應的加權參數。於一些實施例中,存儲器211
之類別-搜尋欄位-權重對應資料庫2113中可先預存類別-搜尋欄位-權重之對應資料,因此該關鍵字搜尋欄位與權重調配模組216於執行搜尋欄位與權重調整與分配作業時,可於存儲器211之類別-搜尋欄位-權重對應資料庫2113中取得類別-搜尋欄位-權重之對應資料。應強調的是,本步驟之搜尋欄位與權重調整與分配作業並不以上述實施例為限,且可依據實際應用需求而任施變化,藉此以增加關鍵字組搜尋範圍的廣度,並達到以關聯性進行檢索之功效。
然後,如步驟S13所示,於完成搜尋欄位與權重調整與分配作業後,處理器210係執行該搜尋及關聯度分數計算模組217,以對每一個候選關鍵字句依據其選定的一個或多個搜尋欄位於法學資料庫22之複數筆法學資料221進行檢索,以檢索過濾出複數筆候選法學資料221。同時,依據給定的加權參數以及一特定演算法進行關聯度分數計算。舉例而言,對於任一筆檢索過濾取得之法學資料211而言,上述候選關鍵字句「訴字第一四四二號」出現在該筆法學資料211之「判決字號」欄位依據該欄位對應給定之加權參數wa1所計算取得之權重值為a1,出現在該筆法學資料211之「判決主文」欄位依據該欄位對應給定之加權參數wa2所計算取得之權重值為a2,因此對該筆法學資料211而言,該候選關鍵字句「訴字第一四四二號」之總權重值為a1+a2。相同地,對該筆法學資料211而言,其他上述的候選關鍵字句亦以同樣方式計算其總權重值。之後,將所有候選關鍵字句計算取得之總權重值相加總,以取得該筆法學資料211之關聯度分數。檢索過濾取得之複數筆候選法學資料211分別利用上述方法計算取得各自之關聯度分數。於本實施例中,每筆候選法學資料211之關聯度分數係為該筆候選法學資料與關鍵字組的關聯度高低判斷依據,若關聯度分數越高代表該筆候選法學資料與該關鍵字組的關聯度越高;反之,若關聯度分數越低
代表該筆候選法學資料與關鍵字組的關聯度越低。應強調的是,本步驟之搜尋及關聯度分數計算作業並不以上述實施例為限,且可依據實際應用需求而任施變化。
於一些實施例中,該筆候選法學資料211若為「判例」或「高價值裁判」等具特殊性、高價值性之法學資料時,該筆候選法學資料之關聯度分數則依照該法學資料本身性質進一步加成其權重分數,以使具特殊性、高價值性之該筆候選法學資料之關聯度提高。前述之「判例」係指已經生效的判決,法院在判決類似案件時援用為先例,這類被援用的判決先例稱為「判例」。應強調的是,本步驟之法學資料加成權重選擇並不限於「判例」或「高價值裁判」,其他具有具特殊性、高價值性之法學資料亦可列入參考。
之後,如步驟S14所示,於完成搜尋及關聯度分數計算作業之後,檢索伺服器21之排序模組218將被執行,以依照複數筆候選法學資料211之關聯度分數進行排序作業,即依照複數筆候選法學資料211之關聯度分數由高到低依序排序,以將關聯度分數最高(即關聯度最高)的候選法學資料211排於第一筆,將關聯度分數次高(即關聯度次高)的候選法學資料排於第二筆,並以此類推,以產生以關聯性排序之一檢索查詢結果。
最後,如步驟S15所示,於完成關聯度排序作業之後,伺服器21之資料輸出模組219係被執行,以將依照關聯度排序後之候選法學資料211輸出,並藉由通訊網路20將檢索結果提供且顯示於使用者裝置23,以供使用者瀏覽,如第8圖所示。於一些實施例中,處理器211之資料輸出模組219更包括高亮標示單元219a,以將每筆候選法學資料211中出現候選關鍵字句的位置以高亮標示方式(例如但不限於灰階標示、彩色標示、粗體標示或底線標示)呈現,藉此以利使用者快速閱覽所需
資訊。於另一些實施例中,處理器211之資料輸出模組219更包括內容擷取單元219b,以將每筆候選法學資料211中相對較為重要之段落擷取呈現(例如該筆候選法學資料中具較高權重值之欄位或段落),藉此以利使用者快速閱覽所需資訊。
於一些實施例中,使用者裝置23之智能檢索介面11於顯示該查詢結果之頁面時,更可包括一排序切換按鍵234(如第8圖所示),其中該排序切換按鍵234可供使用者點選,以切換為依據日期排序呈現查詢結果,以便於使用者靈活應用。於本實施例中,處理器211於接收到使用者裝置23發出之排序切換要求時,處理器211之排序模組218係被執行,以將複數筆候選法學資料211依據日期(例如判決日期、公開日期、公告日期)進行排序作業,之後,並經由資料輸出模組219而將依據時間排序之檢索結果提供至使用者裝置23顯示,以供使用者瀏覽。於一些實施例中,使用者裝置23之智能檢索介面11於顯示該查詢結果之頁面時,更可包括一推薦關鍵字組連結(未圖示),以同時顯示可能具有關聯性之關鍵字組之至少一搜尋連結。當查詢結果並非使用者欲搜尋之法學資料時,使用者可點選系統提供之推薦關鍵字組的對應搜尋連結,以進行其他可能具有關聯性之關鍵字組的搜尋作業,達到使用上的便利性。於本實施例中,處理器211之關鍵字標記與選擇性擴展模組214可將候選關鍵字組,以連結方式提供至使用者裝置23之智能檢索介面11之推薦關鍵字組連結。
根據本案之構想,關聯度分數計算方式並不以上述實施例為為限。第9圖為本案較佳實施例之關聯度分數計算流程圖。如第9圖所示,本案之關聯度分數計算方法包括如下步驟。首先,如步驟S21所示,依據候選關鍵字句所帶有之標記判斷該候選關鍵字句為裁判類或法規類。舉例而言,候選關鍵字句「貪污治罪條例」所帶有之標記係代表「法
規名稱」,因此依據該標記可判斷該候選關鍵字句所屬類別為「法規名稱」,並進一步將其歸類為法規類;相對地,候選關鍵字句「違反貪污治罪條例」所帶有之標記係代表「判決案由」,因此依據該標記可判斷該候選關鍵字句所屬類別為「判決案由」,並進一步將其歸類為裁判類。以上係以舉例方式進行說明,其判斷類別之方式不以此為限,可依據實際情形任施變化。接著,如步驟S22所示,處理器211之搜尋及關聯度分數計算模組217依據前述判斷結果提供對應於該裁判類或該法規類之各自特定關聯度分數演算法,換言之,若候選關鍵字句被歸類為法規類,則以一法規關聯度計算程序對該法學資料進行運算,並得出該候選關鍵字句於該法學資料之關聯度分數;若候選關鍵字句被歸類為裁判類,則以一裁判關聯度計算程序對該法學資料進行運算,並得出該候選關鍵字句於該法學資料之關聯度分數。最後,如步驟S23所示,將所有候選關鍵字句於該筆候選法學資料之所有關聯度分數進行加總,俾得出該筆候選法學資料之關聯度分數。
請繼續參閱第9圖,承上所述,該法規關聯度分數計算程序係透過下列公式進行運算:
其中,Max(matchWeight)為最大的得分,適用在名稱完全符合的情況中;matchWeight為一般符合規則情況下的得分(意即非為最大權重的情況下皆屬之);tieBreak為一加權參數;n為檢索條件之總數,透過此公式之運算以計算出該法學資料的關聯度分數(Score)。舉例來說,請參閱表一,若所輸入的關鍵字句為「刑法」且該筆法學資料為「中華民國刑法」時,輸入之關鍵字句「刑法」經標記與擴展後成為「中華民國刑法」、「刑法」等候選關鍵字句,當檢索條件為「刑法」或「中華民國刑法」時,該法學資料「中華民國刑法」符合檢索條件,
且名稱完全吻合,故適用最大的得分Max(matchWeight)。再者,當檢索條件分別為『「刑」開頭、且「法」或「條例」結尾』、『包含「刑」、「法」並依順序出現』...等情況時,該筆法學資料「中華民國刑法」亦符合檢索條件,並適用一般符合規則情況下的得分,並依據公式1計算將其進行運算加總,得出該法學資料「中華民國刑法」之關聯度分數(如表一所示)。
請繼續參閱第9圖,承上所述,該裁判關聯度分數計算程序係透過下列公式進行運算:
其中,queryNorm i,j 為正規化搜尋分數,其計算公式為:
tf i,j 為候選關鍵字句i在欄位j裡出現的次數,其計算公式為:
idf i,j 係為候選關鍵字句i在所有法學資料中的稀有度,其計算公式為:
(公式5)idf i,j =1+log(文件總數/(包含關鍵字總數+1))
fieldweight則為該搜尋欄位j的加權參數,以區分欄位之重要程度。透過此公式之運算以計算出該筆法學資料的關聯度分數(Score)。舉例來說,請參閱表二,若輸入之關鍵字句為「公務員利用職務貪污」且該筆法學資料為「臺灣高等法院臺南分院刑事判決99年度上訴字第839號」之判決書時,則其關聯度分數計算說明如下。經標記與擴展後之候選關鍵字句可包括例如但不限於「公務員利用職務」及「貪汙」等候選關鍵字句,並以搜尋欄位為「案由」及「裁判內文」進行搜尋。其中,候選關鍵字句「公務員利用職務」並未出現於搜尋欄位「案由」中,故queryNorm、tf及idf數值均為0;候選關鍵字句「貪汙」於搜尋欄位「案由」出現一次,經由公式4計算出tf=1,再經由公式3計算出queryNorm=0.94229126,且經由公式5計算出「貪汙」於所有法學資料中的稀有度idf=6.9492507。接著,分別計算出候選關鍵字句「公務員利用職務」於搜尋欄位「裁判內文」、候選關鍵字句「貪汙」於搜尋欄位「裁判內文」之queryNorm、tf及idf數值,由於計算方式與本段落前半段所述計算方式相仿,故於此不再贅述。最後,所有queryNorm、tf及idf數值計算完成後,經由公式2進行運算便可得出該筆法學資料(判決書)「臺灣高等法院臺南分院刑事判決99年度上訴字第839號」之關聯度分數(score)=120.235306。
綜上所述,本案之法學資料搜尋系統及搜尋處理方法,其可提供與關鍵字具關聯性的相關法學資料,提高檢索的精確度,提供友善且易於操作的使用者體驗,並且可以節省使用者檢索與閱覽的時間。
本案得由熟知此技術之人士任施匠思而為諸般修飾,然皆不脫如附申請專利範圍所欲保護者。
S10~S15‧‧‧法學資料搜尋系統之搜尋處理方法之步驟
Claims (23)
- 一種法學資料搜尋系統,包含:一法學資料庫,儲存複數筆法學資料;一用戶端裝置,包括一智能檢索介面,其中該智能檢索介面係供一使用者輸入一關鍵字組;以及一檢索伺服器,與該法學資料庫及該用戶端裝置相連結與通訊,且包括一處理器,其中該處理器依據該用戶端裝置之該關鍵字組進行一法學資料搜尋作業,該處理器包括:一關鍵字標記與選擇性擴展模組,將該關鍵字組之一個或複數個關鍵字句進行一標記作業與選擇性地進行一擴展作業,以取得複數個候選關鍵字句,其中每一個該候選關鍵字句分別帶有一標記,且該標記係與該候選關鍵字句之一類別相關聯;一關鍵字搜尋欄位與權重調配模組,依據該複數個候選關鍵字句與所屬之該標記選定各該候選關鍵字句之對應搜尋欄位以及對應加權參數;一搜尋及關聯度分數計算模組,依據該複數個候選關鍵字句搜尋該法學資料庫之該複數筆法學資料,以取得複數筆候選法學資料,並對該複數筆法學資料進行各筆該候選法學資料之關聯度分數計算,其中該關聯度分數係為該複數個候選關鍵字句之各權重值之總和,各該候選關鍵字句之該權重值係由至少一參數計算而得,該至少一參數包含出現於該筆候選法學資料之對應搜尋欄位之次數參數、該候選關鍵字句之一稀有度參數以及該候選關鍵字句之該對應搜尋欄位之一加權參數;以及一排序模組,依據複數筆候選法學資料之關聯度分數進行一關聯度排序作業,俾提供經關聯度排序之複數筆候選法學資料至該使 用者裝置。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該檢索伺服器與該法學資料庫係共同設置於一主機,並透過至少一連接埠相連結與通訊,其中該檢索伺服器與該用戶端裝置分別與一通訊網路連結,且該檢索伺服器與該用戶端裝置透過該通訊網路相連結與通訊。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該檢索伺服器、該法學資料庫以及該用戶端裝置分別與一通訊網路連結,且該檢索伺服器、該法學資料庫以及該用戶端裝置透過該通訊網路相連結與通訊。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該智能檢索介面包括單一之搜尋欄位及搜尋按鍵,其中該搜尋欄位係架構於輸入該關鍵字組,且該搜尋按鍵係架構於啟動該法學資料搜尋作業。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該檢索伺服器更包括一存儲器,該存儲器包括一程式、一擴展詞庫、一類別-搜尋欄位-權重對應資料庫以及一權重參數資料庫。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該處理器更包括一資料輸出模組,將經關聯度排序後之該複數筆候選法學資料輸出,並藉由一通訊網路將一法學資料檢索結果提供至該使用者裝置顯示。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該擴展作業包括同義字詞擴展、數字轉國字擴展、國字轉數字擴展、法規名稱擴展、法規條號擴展、案件性質擴展、案號辨識與擴展或法院辨識與擴展。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該類別係為法院名稱、刑事判決、民事判決、行政判決、判決字號、判決案由、判決日期、裁判主文、法規名稱或法規內文。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該排序模組係依照該複數筆候選法學資料之各該關聯度分數由高至低依序排序。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該處理器之該資料輸出模組包括一高亮標示單元,以將該複數筆候選法學資料中出現該複數個候選關鍵字句之位置進行標示。
- 如申請專利範圍第1項所述之法學資料搜尋系統,其中該處理器之該資料輸出模組包括一內容擷取單元,以將該複數筆候選法學資料之各該筆候選法學資料進行部分內容擷取,以於顯示於該使用者裝置。
- 一種法學資料搜尋處理方法,用於一法學資料搜尋系統以進行一法學資料搜尋作業,其中該法學資料搜尋系統包括一檢索伺服器,該檢索伺服器包括一處理器架構於執行該法學資料搜尋作業,該法學資料搜尋處理方法包括步驟:(a)接收一關鍵字組,對該關鍵字組之一或複數個關鍵字句進行一標記作業以及選擇性地進行一擴展作業,以取得複數個候選關鍵字句,其中每一個該候選關鍵字句分別帶有一標記,且該標記係與該候選關鍵字句之一類別相關聯;(b)依據該複數個候選關鍵字句與所屬之該標記選定各該候選關鍵字句之對應搜尋欄位以及對應加權參數;(c)依據該複數個候選關鍵字句搜尋一法學資料庫之複數筆法學資料,以取得複數筆候選法學資料,並對該複數筆法學資料進行各筆該候選法學資料之關聯度分數計算;以及(d)依據複數筆候選法學資料之關聯度分數進行一關聯度排序作業,該候選法學資料之該關聯度分數係為該複數個候選關鍵字句之各權重值之總和,各該候選關鍵字句之該權重值係由至少一參數計算而得,該至少一參數包含出現於該筆候選法學資料之對應搜尋欄位之次數參數、該候選關鍵字句之一稀有度參數以及該候選關鍵字句之該對應搜尋欄位之一加權參數,俾提供經關聯度排序之複數筆候選法學資料。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中該處理器包括一關鍵字標記與選擇性擴展模組、一關鍵字搜尋欄位與權重調配模組、一搜尋及關聯度分數計算模組以及一排序模組,其中該步驟(a)係由該關鍵字標記與選擇性擴展模組執行,該步驟(b)係由該關鍵字搜尋欄位與權重調配模組執行,該步驟(c)係由該搜尋及關聯度分數計算模組,以及該步驟(d)係由該排序模組執行。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中於該步驟(a)中,進行該標記作業係先於進行該擴展作業。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中於該步驟(a)中,進行該擴展作業係先於進行該標記作業。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其更包括步驟(e):將經關聯度排序後之該複數筆候選法學資料輸出,並藉由一通訊網路將一法學資料檢索結果提供至一使用者裝置顯示。
- 如申請專利範圍第16項所述之法學資料搜尋處理方法,其中該步驟(e)更包括步驟:(e1)將該複數筆候選法學資料中出現該複數個候選關鍵字句之位置進行標示;以及(e2)將該複數筆候選法學資料之各該筆法學資料進行部分內容擷取,以顯示於該使用者裝置。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中該擴展作業包括同義字詞擴展、數字轉國字擴展、國字轉數字擴展、法規名稱擴展、法規條號擴展、案件性質擴展、案號辨識與擴展或法院辨識與擴展。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中該類別係為法院名稱、刑事判決、民事判決、行政判決、判決字號、判決案由、判決日期、裁判主文、法規名稱或法規內文。
- 如申請專利範圍第12項所述之法學資料搜尋處理方法,其中於該步驟(d)中,該排序作業係依照該複數筆候選法學資料之各該關聯度分數由高至低依序排序。
- 一種法學資料搜尋處理方法,用於一法學資料搜尋系統以進行一法學資料搜尋作業,其中該法學資料搜尋系統包括一檢索伺服器,該檢索伺服器包括一處理器架構於執行該法學資料搜尋作業,該法學資料搜尋處理方法包括步驟:(a)接收一關鍵字組,對該關鍵字組之一或複數個關鍵字句進行一擴展作業,以取得複數個候選關鍵字句;(b)依據該複數個候選關鍵字句搜尋一法學資料庫之複數筆法學資料,以取得與該關鍵字組具關聯性之複數筆候選法學資料,並對該複數筆法學資料進行各筆該候選法學資料之關聯度分數計算;以及(c)依據複數筆候選法學資料之關聯度分數進行一關聯度排序作業,該候選法學資料之該關聯度分數係為該複數個候選關鍵字句之各權重值之總和,其中各該候選關鍵字句之該權重值係由至少一參數計算而得,該至少一參數包含出現於該筆候選法學資料之對應搜尋欄位之次數參數、該候選關鍵字句之一稀有度參數以及該候選關鍵字句之該對應搜尋欄位之一加權參數,俾提供經關聯度排序之複數筆候選法學資料。
- 如申請專利範圍第21項所述之法學資料搜尋處理方法,其中該擴展作業包括同義字詞擴展、數字轉國字擴展、國字轉數字擴展、法規名稱擴展、法規條號擴展、案件性質擴展、案號辨識與擴展或法院辨識與擴展。
- 一種電腦可讀取記憶媒體,其係儲存一程式,且於一法學資料搜尋系統之一檢索伺服器載入並執行該程式後,該檢索伺服器係執行如申請專利範圍第12項所述之法學資料搜尋處理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW105142810A TWI595371B (zh) | 2016-12-22 | 2016-12-22 | 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW105142810A TWI595371B (zh) | 2016-12-22 | 2016-12-22 | 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TWI595371B true TWI595371B (zh) | 2017-08-11 |
| TW201824028A TW201824028A (zh) | 2018-07-01 |
Family
ID=60189342
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW105142810A TWI595371B (zh) | 2016-12-22 | 2016-12-22 | 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TWI595371B (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI640882B (zh) * | 2017-12-26 | 2018-11-11 | 七法股份有限公司 | 法學資料探勘系統及法學資料探勘方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060248440A1 (en) * | 1998-07-21 | 2006-11-02 | Forrest Rhoads | Systems, methods, and software for presenting legal case histories |
| CN1965313A (zh) * | 2003-12-31 | 2007-05-16 | 汤姆森环球资源股份公司 | 判例法与法律案情摘要、诉讼文档和/或其它诉讼支持文档的结合的系统、方法、软件和接口 |
| TW201128416A (en) * | 2010-02-11 | 2011-08-16 | Alibaba Group Holding Ltd | Search result generating method and information search system |
| TW201131399A (en) * | 2010-03-09 | 2011-09-16 | Alibaba Group Holding Ltd | Indexing method and apparatus |
| TW201502814A (zh) * | 2013-04-08 | 2015-01-16 | Hon Hai Prec Ind Co Ltd | 資訊檢索系統及方法 |
-
2016
- 2016-12-22 TW TW105142810A patent/TWI595371B/zh active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060248440A1 (en) * | 1998-07-21 | 2006-11-02 | Forrest Rhoads | Systems, methods, and software for presenting legal case histories |
| CN1965313A (zh) * | 2003-12-31 | 2007-05-16 | 汤姆森环球资源股份公司 | 判例法与法律案情摘要、诉讼文档和/或其它诉讼支持文档的结合的系统、方法、软件和接口 |
| TW201128416A (en) * | 2010-02-11 | 2011-08-16 | Alibaba Group Holding Ltd | Search result generating method and information search system |
| TW201131399A (en) * | 2010-03-09 | 2011-09-16 | Alibaba Group Holding Ltd | Indexing method and apparatus |
| TW201502814A (zh) * | 2013-04-08 | 2015-01-16 | Hon Hai Prec Ind Co Ltd | 資訊檢索系統及方法 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI640882B (zh) * | 2017-12-26 | 2018-11-11 | 七法股份有限公司 | 法學資料探勘系統及法學資料探勘方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| TW201824028A (zh) | 2018-07-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11449767B2 (en) | Method of building a sorting model, and application method and apparatus based on the model | |
| US8965872B2 (en) | Identifying query formulation suggestions for low-match queries | |
| CN104537116B (zh) | 一种基于标签的图书搜索方法 | |
| CN112667794A (zh) | 一种基于孪生网络bert模型的智能问答匹配方法及系统 | |
| US9754022B2 (en) | System and method for language sensitive contextual searching | |
| US20180181544A1 (en) | Systems for Automatically Extracting Job Skills from an Electronic Document | |
| JP6056610B2 (ja) | テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム | |
| US9075898B1 (en) | Generating and ranking incremental search suggestions for personal content | |
| CN109508441B (zh) | 通过自然语言实现数据统计分析的方法、装置及电子设备 | |
| CN110321561B (zh) | 一种关键词提取方法和装置 | |
| US11151317B1 (en) | Contextual spelling correction system | |
| US20250061140A1 (en) | Systems and methods for enhancing search using semantic search results | |
| CN112182145A (zh) | 文本相似度确定方法、装置、设备和存储介质 | |
| US20090119283A1 (en) | System and Method of Improving and Enhancing Electronic File Searching | |
| US10621252B2 (en) | Method for searching in a database | |
| CN118797005A (zh) | 智能问答方法、装置、电子设备、存储介质及产品 | |
| Sukumar et al. | Semantic based sentence ordering approach for multi-document summarization | |
| JP2017068862A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
| TWI595371B (zh) | 法學資料搜尋系統、搜尋處理方法及電腦可讀取紀錄媒體 | |
| JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
| CN112270199A (zh) | 基于CGAN方法的个性化语义空间关键字Top-K查询方法 | |
| JP2012104051A (ja) | 文書インデックス作成装置 | |
| CN110688559A (zh) | 一种检索方法及装置 | |
| JP6173958B2 (ja) | 複数のハッシュテーブルを用いて検索するプログラム、装置及び方法 | |
| CN118467669B (zh) | 索引构建方法、字段搜索方法、装置、设备及介质 |