卷宗主動歸目
聯合基于深度進修的OCR、圖象剖析和實體辨認等技術,完成電子卷宗資料的主動分類;支撐罕見圖片類型、pdf、word、excel等格局;支撐3600多類資料;民事、刑事、行政、履行、補償、弛刑假釋類卷宗,主動歸目精確率到達95%以上。
文檔題目辨認
基于自研的OCR技術,聯合辨認後的文本和文本的地位坐標信息,采取卷積神經網絡的文天職類辦法,經由過程大批的樣本標注和練習,完成對圖片資料和文本文檔的題目辨認;行業內文檔題目辨認精確率可達92%。
司法實體辨認
基于深度進修,將天然說話懂得技術和司法邏輯系統相聯合,可對公、檢、法、司、仲裁等多個行業100多類文書停止信息項提取,可提守信息項數目跨越1萬項。 
關系提取
將基于深度進修的天然說話懂得技術和形式辨認技術相聯合,應用生成模子,聯合關系圖譜,主動辨認文本中的實體並抽取實體之間的關系;支撐100+種司法關系和社會關系。 
事宜提取
應用觸發詞對事宜停止分類,基于人工標注數據,采取實體辨認技術和文天職類技術提起事宜中的主體、客體和其他參數等信息,完成事宜提取;支撐花費類、文娛運動類、賄賂納賄類等8大類事宜;事宜提取精確率可達85%。 
司法智能問答
基于人工梳理問答對,聯合天然說話懂得和機械進修的技術,完成具有語義懂得的問答體系;並支撐依據預定槽位和狀況,靈巧設置裝備擺設相符營業邏輯的對話治理戰略,完成了義務式對話。
司法文墨客成
經由過程機械進修技術,基于“司法認知”技術,從海量文書中進修出分歧類型文書中針對司法現實的經常使用表述規矩,經過司法專家校准,固化構成專業的文書表述邏輯和規矩庫,完成爲用戶智能地依據案情的分歧生成分歧的文書表述。 
裁判文書校訂
基于百萬司法文書和50G網頁素材,采取天然說話懂得技術,並聯合首創的裁判文書詞法剖析技術,完成了貼合文書特色、尊敬用戶習氣、相符格局標準安的文書智能校訂功效;主動聯合辦案體系數據與文手劄息,支撐字詞、語法、標點、文書構造、營業邏輯、司法律例的全方位校訂,支撐語音讀校,支撐word插件。 
裁判文書排版
完成對文書格局的主動排版和標準。排版格局根據的模板可以由用戶依據現實營業須要同壹對模板做修正和更新,異常便利靈巧。 
裁判文書屏障
基于天然說話懂得技術和實體辨認技術完成對司法裁判文書敏感信息屏障的功效。在文書屏障的過程當中嚴厲依照《最高人民法院關于人民法院在互聯網頒布裁判文書的劃定》的請求對敏感辭匯停止屏障。 
庭審筆錄歸結
深刻剖析語音辨認處置的筆錄特點,起首基于序列標注模子對語音辨認出來的筆錄停止精簡,去除白話描寫和反復表達等,再采取Seq-to-Seq模子完成筆錄歸結,以晉升主動生成筆錄的標準性和可讀性。 
證據猜測
剖析各類文書數據中的案情,並對個中現實和證據的關系停止標注,基于數十萬人工標注的高質量數據,練習Seq-to-Seq模子,完成在給定現實的條件下生成其能夠依附的證據,證據猜測精確率可達90%。 
案由猜測
基于案件文書全文、文書段落、案件情節、案件現實描寫,經由過程天然說話懂得技術,提取案情特點,將LSTM模子和CNN模子等停止融會,並采取多義務結合練習的方法,完成結案由猜測。 
法條猜測
基于案件情節,經由過程天然說話懂得技術,提取案情特點,將LSTM模子和CNN模子等停止融會,並采取多義務結合練習的方法,完成了相幹法條猜測。 
裁判紀律剖析
基于司法常識圖譜和天然說話懂得技術,對400多萬公開刑事裁判文書周全發掘剖析,經由過程法學專家和實務專家從營業理論動身,聯合司法律例、司法說明等標準性文件的請求,構建出實用于分歧場景下的動態常識模子,應用模子對多元數據停止抽取,進而剖析類案的汗青裁判紀律,供給司法常識辦事。 
卷宗資料OCR
基于AI深度進修算法,應用圖象剖析、字符辨認等技術,對卷宗資料文件完成智能感知剖析,供給卷宗資料文字辨認才能;支撐文本、表格、卡證辨認,精確率分離爲96%以上、85%以上、70%以上;支撐中文簡體、繁體、英文印刷文本辨認;支撐圖象的糾偏和翻轉;單張圖片的辨認速度爲毫秒級。 
司法視頻剖析
基于庭審、詢問、說話、監舍等司法行業場景停止深度進修及大範圍圖象練習,精確辨認物體標簽、地位、行動意圖、相信度、圖象質量等綜合信息。支撐人、國徽、法袍、 桌牌、帽子、墨鏡等目的標識;支撐打電話、吸煙等行動辨認;支撐過亮、過暗、隱約、遮擋等畫面質量辨認。 
卡證辨認
基于深度進修的ocr和目的檢測技術,對二代居民身份證、律師證、靈活車駕駛證、靈活車行駛證等停止辨認;支撐證件的正不和檢測和分頁檢測;支撐自界說卡證辨認模板;應用大批圖片樣本練習模子,具有高精確率,如身份證辨認精確率跨越90%。 
表格辨認
基于圖象剖析技術和ocr技術,對表格信息停止精度定位和辨認,完成龐雜表格的智能字段提取。支撐存在歸並單位格的龐雜表格;支撐自界說表格辨認模板;辨認辨認率到達90%以上。 
指紋、印章等辨認
基于深度進修的目的檢測技術,完成對文檔中的指紋和簽章等檢測辨認;並經由過程色彩模子和OpenCV相聯合,完成對紅章和指紋停止抹除。支撐人像、指紋、紅章、方章、長方章、合縫章、二維碼、條形碼,紅頭文件等辨認,且辨認精確率可以或許到達96%以上。 
卷宗中手寫標簽辨認
針對卷宗中存在手寫資料的特色,基于深度進修技術,完成了手寫標簽的辨認,擴展了卷宗文件類型辨認的規模。支撐訴狀、欠條、收據、證實、情形解釋等78類標簽。 
卷宗圖象優化
針對卷宗文件多爲掃描件的特色,對卷宗文件停止圖象消除黑邊、空白頁檢討、圖象糾偏、圖象DPI檢測、圖象虛化檢測等功效。 
司法常識圖譜
司法常識圖譜屬于垂直行業範疇的常識圖譜,從圖示的直不雅情勢看,是浩瀚司法要素構成的常識庫。司法常識圖譜是機械停止司法常識推理的基本,它將司法劃定、司法文書、證據資料及其他司法材料中的司法常識點以必定的司法邏輯銜接在壹路構成概念框架,它的概念框架上的每個常識實體或概念又分離與司法律例、司法經歷、案例、證據資料等響應挂接,樹立司法概念、司法律例、現實、證據之間的動態聯系關系關系。 
司法數據融會
樹立行業數據融會規矩,根據司法常識解析並提煉數據,基于語義完成構造化、半構造化與非構造化的多源異構數據融會,構建關系模子,基于司法語義辨認並樹立數據實體間的聯系關系關系,處理數據的完全性、分歧性和相幹性等成績,構成高度融會的數據資本地圖。 
當事人畫像
經由過程數據發掘方法將疏散至各運用體系中焦點營業群體的零碎信息停止提煉,以根本信息、行動信息、涉案信息、資産信息、信譽信息等爲維度,描繪出與案件相幹確當事人的畫像,知足分歧場景下各主體關於人員或許人群全癥結信息的分歧條理需求。 
案件畫像
基于大數據剖析、天然說話懂得、圖象剖析等多項技術相聯合,完成案件構造化數據、案件文書、相幹卷宗等多元異構數據的內容層面的深度聯系關系融會;以根本信息、主體信息、資料信息、流程信息、聯系關系案件信息、庭審信息等維度,描繪完全、精確的案件畫像。 
法官畫像
以裁判文書爲基准,對詳細法官的辦案數據、特點目標、聯系關系圖譜、證據、爭議核心、裁判概念等停止各角度剖析,展現法官對某種主意采用或不采用、法官認定某種司法效果/抗辯來由組成或不組成的裁判偏向,爲院庭領導周全懂得和評價法官任務供給參考幫助。 
涉案人員同路會見剖析
基于大數據技術和數據發掘技術,深刻剖析被查詢拜訪人話單的數據特點,聯合通信基站信息和GIS體系,將被查詢拜訪人與相幹涉案人員之間通話記載停止碰撞,智能剖析兩邊或多方在鄰近時光且相鄰地位的情形,進而完成同路會見剖析。 
涉案人員配合聯系人剖析
應用數據發掘技術,深刻剖析被查詢拜訪人話單的數據特點,從通話次數、時長,存眷人員人數等多個維度停止剖析,進而發明相幹涉案人員的配合聯系人;支撐多名人員之間經由過程若幹層級中央人停止聯系的情形。 
司法聲明 網站地圖 聯系我們 華宇團體官網

©Thunisoft 台灣華宇信息技術有限公司 版權壹切    京ICP備6480-3 京公網安備 029012號