当今社会企业之间的合作、人与人之间的合作,最常见的是用合同来制定合作的规则。由于合作的对象的不确定性和项目的差异性,会产生不同结构,涉及不同法律法规的合同。
当企业对合同进行审议时,需要熟悉各种法律法规和行业规则从业者对合同条款进行逐条审核,从而避免企业利益因条款问题受到损失。但是,当企业面对大量合同需要人工审议时,审议效率及审议质量也面临了巨大挑战。
为此,益高科技提出以模版类合同为基本数据,运用益高科技最新AI算法研究成果,结合合同中的常见规则,在益高智慧合同管理系统中嵌入AI智能审议引擎,为客户提供操作简单、运用方便、运行快捷的合同审议功能,既提高审议效率,同时也提高审议质量。
技术介绍
近些年随着BERT的提出,自然语言处理算法的准确性有了明显的提高,在实际生产中的运用也越来越被重视。面对自然语言中的各种任务,自然语言处理的研究者围绕BERT和其他算法结合的思路,对现有算法进行组合调整。算法开始在各种领域开始运用,并取得了显著的效果。
BERT核心Transformer的主体结构:
Transformer主要由多头注意力机制,编码器和解码器组成整体结构。在对一句话进行编码时,不单单只考虑每个字之间的差异,还将每个字在一句话中的位置进行编码,考虑了同一个字在不同位置时表达不同的意思,这让模型能够更好的理解文本中每个字在一句话中的意思。
编码器采用残差网络的跳连结构,当文本传入算法经过网络的前向传播进行特征提取可能损失部分信息,跳连结构会将原始文本信息和经过网络前向传播提取的特征进行合并,使数据在经过网络提取特征后,不会丢失很多信息。
由transformer编码器加入对数据的随机MASK机制构成了现在主流自然语言处理算法BERT的主要结构。BERT具有很强的灵活多变性,它作为优秀的数据特征提取方法,几乎可以和其他任意的算法相结合以应对各种自然语言处理任务。
由BERT+BI_LSTM+CRF+NER组合形成当前命名实体任务的主要算法结构,由BERT和RNN, CNN等其他分类算法相结合实现文本分类的算法,以及其他自然语言处理任务的算法中也常见BERT的影子。下面将具体的介绍这些算法的运用。
主要应用
1、智能识别合同中出现的关键信息
针对合同中出现的人名,地址和日期,益高科技采取传统的命名实体识别算法和当下最新研究成果相结合的办法对模型进行训练。当合同文本信息输入算法时,算法自动提取合同中的人名,地址和日期等关键信息。
2、智能文本比对
面对合同内容较多,篇幅较长,每次签约需要耗费大量人力物力校对两份合同之间差异的场景,益高科技以NLP常见算法为基础,其他算法为辅,结合一些规则的方法,将两份合同进行智能比对,并可快速标识两份合同之间的差异性,保障甲乙双方合同内容的一致性。
3、 智能转换字体与文本格式
针对合同出现的特殊字体要求,比如金额需要大写,日期需要指定格式等,益高科技使用命名实体识别算法为基础的智能修改技术,可一键修改合同中所有需要修改的字体格式,也可点选需要修改的地方进行点选修改。
4、 智能风险提示
面对合同中常见惩罚性的违约规定,益高AI智能审议是通过语义理解相关算法,判断合同中可能存在的风险,并自动生成有关风险提示,这些风险提示也可根据用户实际情况进行修改。
面对日益增多的合同与繁琐合同审议环节,益高科技将面向未来智能时代,为客户量身打造适合自己的智慧合同管理平台,助力企业合同管理向着方便,快捷,智能的方向发展。