search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

【智慧公訴】這樣的「人工智慧」簡直就是公訴人的貼心小幫手

應用人工智慧是各個行業發展的趨勢,也是檢察工作發展的趨勢,人工智慧在哪些方面可以為公訴工作服務呢?

根據我的思考,我現在談談我的看法:

一、卷宗數據化

公訴工作怎麼應用人工智慧呢?

首先要找到數據源,沒有數據源巧婦難為無米之炊。

那麼,什麼是我們的數據源呢?

我們的數據源,就是我們的卷宗和法律文本,卷宗包括歷史卷宗和在辦案件卷宗,其中也包括刑事裁判文書。

我們的歷史的卷宗怎麼才能變成數據卷宗呢?

過去,我們經常提到電子卷宗。但是,電子卷宗的概念在不斷的演變和進化,已經混亂了。最早的電子卷宗,是把卷宗掃描的圖片稱為電子卷宗。接下來進行OCR識別,形成文字版,把這個文字版也稱為電子卷宗。

我們用大數據的思維去審視這個文字版的卷宗,那麼,還沒有到位,應該把我們漢字識別之後的電子卷宗進行數據化處理。為了區別開來,我把新的電子卷宗形式,稱為數據卷宗。

那麼,是什麼形式呢?

從一個卷宗里的內容里抽取罪名、地點、手段、情節及量刑等諸多數據,保持關聯性,存入資料庫,這個時候的電子卷宗可以進行數據化處理,這就是我們的數據化卷宗的形式。

有了數據卷宗,我們就有了一個足夠大的數據源,這個是大數據應用的基礎。

有了這個基礎,我們才可以更好的應用數據卷宗,開展各類大數據與人工智慧的開發。

目前,我們檢察機關案管部門接到卷宗,都需要用手工方法把案卷的基礎數據錄入軟體,進行管理。這種方法效率低、數據類型少和數量小,嚴重地制約了我們對卷宗數據的應用和對案件的分析。如果有了製作數據化卷宗的手段,卷宗來了,先轉化為數據卷宗。然後,就可以自動抽取案管部門需要的案件信息,人工方法需要一天完成的工作量幾分鐘就可以完成,甚至可以收集更多的信息。

數據化的卷宗應該怎麼製作呢?

我們把卷宗、裁判文書和法律法規進行掃描識別,然後應用語義分析的分詞軟體程序,把卷宗中的文字按辭彙進行分割,分出一個個的獨立的詞語,並且可以分出詞性及褒貶,機器的智慧已經到了這種程度。

我用軟體做了一個「交通肇事案」語義分析的測試,在分析中,既分出來了若干個基礎的辭彙,也分出常用固定連接辭彙,如:「東湖」、「公安」、「分局」及合成詞「東湖公安分局」等,形成實用性更強的有效辭彙。

對所有文本進行分類,即進行辭彙、詞義的分類和人名等的分類,如:把案件中的證人、嫌疑人、被害人自動地全都抽取出來。也就是說,讓機器認識人,並且知道他是什麼角色。

然後是聚類,聚類可以把相同性質的詞進入歸類,相近語義的語句進行歸類。比如:一個人供述自首的幾種語言表達形式,歸為一類。這就為我們接下來一些語義分析提供了最好的資源。

回想一下,各類論文都要我們寫出關鍵詞,這個關鍵詞是什麼用途?就是用於檢索、搜索用的。有了分詞軟體,可以從文章自動找出無限多的關鍵詞。比人工效率高、系統、全面。當然,檢索起來也就需要有龐大的系統進行支持,這也是依賴於計算機技術的發展,有這個大數據處理的能力。這也就是在百度中搜索時,無論你輸入的是文章中的一段話或是一個詞都可以搜到這篇文章,無論詞語是不是文章的重點,也都可以搜到,這也是因為百度對文章進行了全部分詞。這個也是案件推送的基礎。

這些基礎工作形成的信息,要為之建立相應的字典庫,如:法律法規庫、卷宗庫、裁決文書庫及量刑庫等等。

這時,歷史卷宗都是以數據的形式存在。數據可檢索、可關聯、可抽取,為我們的數據應用提供基礎,也提供了針對新卷宗抽取數據的方法策略。

我們在建立法律法規庫的時候,要把所有罪名涉及的犯罪情節抽取出來以及量刑範圍。

我們在建立量刑庫的時候,就要把量刑對應元素在卷宗中出現的材料名稱、位置和與之關聯的提示性語句作做標記,並且把用於補充、印證的語句位置做好標記。

二、數據化卷宗的應用

數據化卷宗存在了,怎麼應用呢?

具體的應用要做系統考慮。我的考慮是這個要以迭代的方式,從最簡單的方式入手,一步步成長,一項項積累,直到全覆蓋。下面我談幾點:

1、智能生成起訴書

我們先來分析一下起訴書所需要的元素。

起訴書第一段的自然概況和最後一段的法律適用是規範的格式,中間段落是證據和犯罪事實部分,這部分隨案件不同存在變化。

自然概況和法律適用,可以從卷宗裡面對應的書證、筆錄及法律文本中抽取相應的元素。比如:強制措施種類與時間,可以從拘留證、逮捕證抽取。罪名對應的法律條文可以從法律文本庫中抽取。

犯罪事實部分,不同的案件有不同的敘述形式,但是某一類案件都有它需要敘述的要點。這個要點是什麼?這就是我們量刑所要必備的量刑情節。我們在敘述案情部分一定要圍繞法律法規所涉及的量刑要點去敘述。

新卷宗到手,人工機智程序就可以按照庫中的標記以及機器理解的範圍進行查找和抽取新卷宗中犯罪情節元素,最後把這些情節元素以流暢的語言形式表述出來。

文書的語言風格也不需要有過多擔心。2017年1月春運期間,《南方都市報》開發出的一款人工智慧機器人,在給定新聞素材后,不到一分鐘就把新聞稿寫出來了,語言的流暢程度可與優秀的記者媲美。按照這個構想所有的法律文書都可以製作完成。

這時,開始有人擔心了,我們的檢察官要做什麼?

  • 我們的檢察官就是審查正確與否,對不準確的稍加修改就可以了。

這裡涉及的案件信息的抽取手段,在人工智慧學習歷史卷宗的過程中,就已經學會了,這裡主要是應用。

2、大數據量刑

先介紹一下我們大慶市讓胡路區檢察院開發的一款量刑軟體。我們的軟體,在手動選取犯罪情節后,可以對15種罪名進行電腦自動量刑。這是依據最高法下發的量刑規範編寫的軟體。

一般來想來,量刑情節是交錯的、複雜的。其實,深入到分析過程中會發現,量刑情節是一個有序疊加的過程。就是加刑情節和減刑情節,哪些是刑期相加、哪些是相減都有據可依,然後再依據總則對全案刑期進行比例增減。對於有列舉量刑情形的罪名,按照相應的公式可以計算得到刑期。

針對最高法量刑規範中明確的15種罪名的犯罪情節與量刑關係的量刑,簡單些。

要做大數據量刑,需要怎樣做?
  • 第一步,犯罪情節的刑期量化

那就是應用人工智慧的方法。把某一個罪名的幾千本卷宗讓機器學習一下,把相應的犯罪情節及其對應的量刑刑期列舉出來,通過建立數學模型對每一種情節的刑期進行量化,具備這些條件,就可以進行基於大數據的量刑了。

  • 第二步,找到犯罪情節

通過大數據的方式,在法律法規庫中找到罪名對應的犯罪情節特徵,然後從新卷宗中抽取犯罪情節。

  • 第三步,代入公式計算

就是把對應犯罪情節的刑期進行加減,並由總則對之進行比例調整。

這樣就完成了對一個新案件的大數據量刑。

3、智能摘錄證據

工作中想要摘卷宗中某個證人敘述的情節,我們若翻卷宗,特別是內容比較多的卷宗,找起來效率低。有了數據化卷宗,我們可以應用查詢功能,直接定位到這段話的位置,如同百度搜索一樣,因為百度搜索也是應用的語義分析的技術。找到的文本內容可以複製,可以進行分析和比較。證據摘錄達到一定程度,機器通過對此過程的學習,也可以進化為自動摘錄的工具,把我們摘錄的習慣學會,機器自動摘錄。並且智能區分摘錄有罪證據、無罪證據,加刑證據、減刑證據,從輕證據、從重證據。

人不需要再做這些事,機器幫我們把這些事做了。人不再做這些手工的事,人只是用智慧審查證據。

4、智能訊問

機器通過對證據摘錄和證據分析行為的學習,就會知道哪些是加重刑罰的證據,哪些是減輕的證據。具有了一定的證據分析鑒別能力之後,就可以進行智能訊問了。

用歷史卷宗對機器進行訓練,可以識別出,嫌疑人在交待關鍵問題時,此前的若干鋪墊性問話是什麼。也可以識別出嫌疑人翻供的有效應對是什麼。也知道哪些是加重刑罰的供述要問,哪些是減輕刑罰的辯解要聽。由人工智慧匯總分析這些問話,找到規律和適用場景,在新的訊問中,就可以依據需要使用這種語言和策略。常規的、規律性的問話,對機器來說不難做到,也看不出比人高明。只有在處理複雜問題時,才可以體現它的優勢。

5、定罪分析

法律的分析邏輯是三段論,也就是通過由法律規定、案件事實得出結論的過程。

當證據分析的能力有了,案件事實的認定能力就有了。有了法律與事實兩個大小前提,得到有罪與否,構成哪個犯罪,就可以做到了。這個分析的過程,再製作出文字的論述過程,這就是審查報告了。

6、多維度推送

多維度推送,最大的特點是:給你想要的。

在你辦理案件時,人工智慧分析你的經歷、知識體系及參考案件需要,想你所想,推送給你所想要查閱的卷宗、法律。

(1)按案件難點推送

人工智慧識別出案件的難點所在,在歷史卷宗中,找到類案進行推送,供我們參考。如果不是難點,推送過來是沒有必要的。

(2)延伸思考推送

無論你辦哪一類案件,人工智慧每次都推送一個未成年人此類犯罪的案件給你。那麼,大量信息衝擊的結果,就會引發你對未成年犯罪的思考與調研。總之,這是基於全卷宗每個詞都是關鍵詞的基礎上,進行有益於興趣閱讀的教學模式的推送。形成辦案與教學培訓相得益彰的效果。

(3)補充知識體系

當你在辦理搶劫案時,但卷宗中涉及嫌疑人是累犯,可能就會推送其他類型犯罪含有累犯的案件。也可能補充學習的是涉案的金融知識或是行政法規。總的來說,是人工智慧偵測到你知識體系的不足,有目的向你推送。

(4)動態推送

在你的辦案主界面不變情況下,每次滑鼠有移動,都可以觸發推送的更新。讓你有更多機會見到你希望看到的推送。有些即便你不點開,也可能產生靈感觸動。

這些都是如同今日頭條和淘寶的推送模式,最終我們遇到的、學到的或是延伸閱讀的知識,是我們自己想要的,還是人工智慧為你規劃好的已經分不清了。總之,就是營造一個以興趣為切入點的自我學習的模式。

這是我對智慧公訴體系的一些思考,僅供大家參考。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦