主要内容

文档解决方案的自然语言处理

深度对齐方式 - 一种专有技术,可以将两个文档的要素关联起来

背景

文档作为表达,交流和存储信息的一种重要作用。

人工智能(AI)已发展到人们期望理解文档内容的水平,作为有助于简化和自动化任务的解决方案的一部分。

自然语言处理(NLP)是此类高级文档解决方案中的关键技术。

解决方案

深度对齐是Ricoh开发的NLP技术。它自动将两个文档对齐,将句子和段落与彼此相似的内容相关联。

该技术可视化两个文档之间的差异。例如,您可以将合同草案与另一个合同草案进行比较,也可以比较类似的文章,并澄清一个或另一个文档中缺少/存在的信息。

技术亮点

深度对齐由下面描述的两种新技术组成。

1.综合单个短语的含义

完整的句子通常具有几种含义。因此,一个句子太大了一个单位,仅基于含义而用于关联。相比之下,一个最小的意义单元的单词太弱了,无法用于关联,因为它倾向于出现在多个句子中。

深度对齐使用的短语,由多个单词组成,作为关联的关键。它综合了通过深度学习获得短语含义获得的单词的含义,从而实现了含义的精确关联。

2.关联句子

在机器翻译领域,已经开发了技术以两种文本将原始句子和翻译句子相关联。传统技术仅具有有限的应用程序,因为他们在两个文本的句子顺序上都假定了相关性。

但是,深度对齐方式独立于句子顺序,因此可以将其应用于联想任务。它可以应用于一对多的关联,其中一个具有多个含义的句子与多个不同的句子相关联,甚至与丢失协会对应的任务相关联。

里科的愿景

除了合同外,深层对齐还具有许多潜在的应用,例如建议,规格,规定等。深度对齐将项目与含义级别相关联,并将大大加速并增强许多任务中的检查过程。

Ricoh将继续与许多合作伙伴公司同时推广该技术,并进一步开发新的NLP技术。