卷宗主动归目
连系基于深度进修的OCR、图象阐发和实体辨认等手艺,完成电子卷宗资料的主动分类;撑持罕见图片范例、pdf、word、excel等格局;撑持3600多类资料;民事、刑事、行政、履行、补偿、弛刑假释类卷宗,主动归目精确率到达95%以上。
文档标题辨认
基于自研的OCR手艺,连系辨认后的文本和文本的地位坐标信息,接纳卷积神经收集的文本分类体例,经过进程大批的样本标注和练习,完成对图片资料和文本文档的标题辨认;行业内文档标题辨认精确率可达92%。
法令实体辨认
基于深度进修,将天然说话懂得手艺和法令逻辑体系相连系,可对公、检、法、司、仲裁等多个行业100多类文书停止信息项提取,可提守信息项数目跨越1万项。 
干系提取
将基于深度进修的天然说话懂得手艺和情势辨认手艺相连系,操纵天生模子,连系干系图谱,主动辨认文本中的实体并抽取实体之间的干系;撑持100+种法令干系和社会干系。 
事务提取
操纵触发词对事务停止分类,基于野生标注数据,接纳实体辨认手艺和文本分类手艺提发难务中的主体、客体和其余参数等信息,完成事务提取;撑持花费类、文娱勾当类、贿赂纳贿类等8大类事务;事务提取精确率可达85%。 
法令智能问答
基于野生梳理问答对,连系天然说话懂得和机械进修的手艺,完成具备语义懂得的问答体系;并撑持根据预约槽位和状况,矫捷设置装备摆设合适营业逻辑的对话办理战略,完成了使命式对话。
法令文书天生
经过进程机械进修手艺,基于“法令认知”手艺,从海量文书中进修出差别范例文书中针对法令现实的经常操纵表述法则,经过法令专家校准,固化组成专业的文书表述逻辑和法则库,完成为用户智能地根据案情的差别天生差别的文书表述。 
裁判文书校订
基于百万法令文书和50G网页素材,接纳天然说话懂得手艺,并连系首创的裁判文书词法阐发手艺,完成了贴合文书特色、尊敬用户习气、合适格局标准安的文书智能校订功效;主动连系办案体系数据与文手札息,撑持字词、语法、标点、文书布局、营业逻辑、法令律例的全方位校订,撑持语音读校,撑持word插件。 
裁判文书排版
完成对文书格局的主动排版和标准。排版格局根据的模板可以或许由用户根据现实营业须要同一对模板做点窜和更新,很是便利矫捷。 
裁判文书屏障
基于天然说话懂得手艺和实体辨认手艺完成对法令裁判文书敏感信息屏障的功效。在文书屏障的进程中严酷根据《最高国民法院对国民法院在互联网发布裁判文书的划定》的请求对敏感辞汇停止屏障。 
庭审笔录归结
深切阐发语音辨认处置的笔录特色,起首基于序列标注模子对语音辨认出来的笔录停止精简,去除白话描写和反复抒发等,再接纳Seq-to-Seq模子完成笔录归结,以晋升主动天生笔录的标准性和可读性。 
证据展望
阐发各种文书数据中的案情,并对此中现实和证据的干系停止标注,基于数十万野生标注的高品质数据,练习Seq-to-Seq模子,完成在给定现实的条件下天生其可以或许依靠的证据,证据展望精确率可达90%。 
案由展望
基于案件文书全文、文书段落、案件情节、案件现实描写,经过进程天然说话懂得手艺,提取案情特色,将LSTM模子和CNN模子等停止融会,并接纳多使命连系练习的体例,完成结案由展望。 
法条展望
基于案件情节,经过进程天然说话懂得手艺,提取案情特色,将LSTM模子和CNN模子等停止融会,并接纳多使命连系练习的体例,完成了相干法条展望。 
裁判纪律阐发
基于法令常识图谱和天然说话懂得手艺,对400多万公然刑事裁判文书周全发掘阐发,经过进程法学专家和实务专家从营业理论动身,连系法令律例、法令诠释等标准性文件的请求,构建出合用于差别场景下的静态常识模子,操纵模子对多元数据停止抽取,进而阐发类案的汗青裁判纪律,供给法令常识办事。 
卷宗资料OCR
基于AI深度进修算法,操纵图象阐发、字符辨认等手艺,对卷宗资料文件完成智能感知阐发,供给卷宗资料笔墨辨认才能;撑持文本、表格、卡证辨认,精确率别离为96%以上、85%以上、70%以上;撑持中文简体、繁体、英文印刷文本辨认;撑持图象的纠偏和翻转;单张图片的辨认速率为毫秒级。 
法令视频阐发
基于庭审、询问、说话、监舍等法令行业场景停止深度进修及大规模图象练习,精确辨认物体标签、地位、行动企图、相信度、图象品质等综合信息。撑持人、国徽、法袍、 桌牌、帽子、墨镜等方针标识;撑持打德律风、吸烟等行动辨认;撑持过亮、过暗、恍惚、遮挡等画面品质辨认。 
卡证辨认
基于深度进修的ocr和方针检测手艺,对二代住民身份证、状师证、灵活车驾驶证、灵活车行驶证等停止辨认;撑持证件的正背面检测和分页检测;撑持自界说卡证辨认模板;操纵大批图片样本练习模子,具备高精确率,如身份证辨认精确率跨越90%。 
表格辨认
基于图象阐发手艺和ocr手艺,对表格信息停止精度定位和辨认,完成庞杂表格的智能字段提取。撑持存在归并单位格的庞杂表格;撑持自界说表格辨认模板;辨认辨认率到达90%以上。 
指纹、印章等辨认
基于深度进修的方针检测手艺,完成对文档中的指纹和签章等检测辨认;并经过进程色彩模子和OpenCV相连系,完成对红章和指纹停止抹除。撑持人像、指纹、红章、方章、长方章、合缝章、二维码、条形码,红头文件等辨认,且辨认精确率可以或许到达96%以上。 
卷宗中手写标签辨认
针对卷宗中存在手写资料的特色,基于深度进修手艺,完成了手写标签的辨认,扩展了卷宗文件范例辨认的规模。撑持诉状、欠条、收据、证实、环境申明等78类标签。 
卷宗图象优化
针对卷宗文件多为扫描件的特色,对卷宗文件停止图象断根黑边、空缺页查抄、图象纠偏、图象DPI检测、图象虚化检测等功效。 
法令常识图谱
法令常识图谱属于垂直行业范畴的常识图谱,从图示的直观情势看,是浩繁法令因素组成的常识库。法令常识图谱是机械停止法令常识推理的根本,它将法令划定、法令文书、证据资料及其余法令资料中的法令常识点以必然的法令逻辑毗连在一路组成概念框架,它的概念框架上的每个常识实体或概念又别离与法令律例、法令经历、案例、证据资料等响应挂接,成立法令概念、法令律例、现实、证据之间的静态接洽干系干系。 
法令数据融会
成立行业数据融会法则,根据法令常识剖析并提炼数据,基于语义完成布局化、半布局化与非布局化的多源异构数据融会,构建干系模子,基于法令语义辨认并成立数据实体间的接洽干系干系,处置数据的完全性、分歧性和相干性等题目,组成高度融会的数据资本舆图。 
当事人画像
经过进程数据发掘体例将分离至各操纵体系中核心营业群体的零星信息停止提炼,以根基信息、行动信息、涉案信息、资产信息、信誉信息等为维度,描绘出与案件相干确当事人的画像,知足差别场景下各主体对职员或人群全关头信息的差别条理需要。 
案件画像
基于大数据阐发、天然说话懂得、图象阐发等多项手艺相连系,完成案件布局化数据、案件文书、相干卷宗等多元异构数据的内容层面的深度接洽干系融会;以根基信息、主体信息、资料信息、流程信息、接洽干系案件信息、庭审信息等维度,描绘完全、精确的案件画像。 
法官画像
以裁判文书为基准,对详细法官的办案数据、特色目标、接洽干系图谱、证据、争议核心、裁判概念等停止各角度阐发,展现法官对某种主意采取或不采取、法官认定某种法令效果/抗辩来由组成或不组成的裁判偏向,为院庭带领周全领会和评价法官任务供给参考帮助。 
涉案职员同路会晤阐发
基于大数据手艺和数据发掘手艺,深切阐发被查询拜访人话单的数据特色,连系通信基站信息和GIS体系,将被查询拜访人与相干涉案职员之间通话记实停止碰撞,智能阐发两边或多方在附近时候且相邻地位的环境,进而完成同路会晤阐发。 
涉案职员配合接洽人阐发
应用数据发掘手艺,深切阐发被查询拜访人话单的数据特色,从通话次数、时长,存眷职员人数等多个维度停止阐发,进而发明相干涉案职员的配合接洽人;撑持多名职员之间经过进程多少层级中心人停止接洽的环境。 
法令申明 网站舆图 接洽咱们

©Thunisoft 北京华宇信息手艺无限公司 版权一切