要确保文档图像内容安全,必须破解哪些技术难题?在日前举行的2023中国图象图形大会《文档图像智能分析与处理》技术论坛上,静安知名科企合合信息公司技术专家,与来自中科院自动化所、北京大学、中国科技大学,以及华为等科研院校、大企业的知名专家及学者,围绕文档图像处理的前沿技术展开“头脑风暴”,寻找文档图像处理领域的未来进阶方向。
论坛上,专家、学者们认为,文档图像智能处理技术已经逐步应用到医疗、教育W体育官网等诸多领域,为各行各业提供了更加高效、智能的文档管理和数据分析解决方案。但如何实现文档图像的智能分析与处理还面临着诸多来自现实的挑战。
合合信息智能技术平台事业部副总经理、高级工程师丁凯认为,文档的多样性和复杂性是文档图像处理中的难点:文档类型和格式繁多,包括报告、合同、发票、证明、证件等。不同类型的文档有不同的格式和布局,例如文档中常常包含图片、表格、图形等各种图像,难以用统一的方法处理。
对此,合合信息通过ROI提取、干扰去除、形变矫正、图像恢复以及图像增强这一整体架构对文档进行智能扫描与识别分析,将文档图像的弯曲矫正、摩尔纹去除,图像质量大幅提升。
除文档图像的通用场景外,合合信息对特定垂直场景下的图像也能进行预处理,针对手写板图片中出现的反光问题,通过算法模型对反光进行“擦除”。
由于版面复杂多变、文本内容多样化等原因,文档被拍照、扫描成电子文档过程中时常出现漏字、错位,对此,合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,确定文档中的文字位置、字体、大小和排版方式等信息,实现版面的分析和还原。
此外,人工智能的合成技术导致伪造的多媒体信息在网络上泛滥成灾,文本图像显然是重灾区之一。针对资质证书、文案、聊天截图等文本图像的伪造被用于散播谣言、经济诈骗、编造虚假新闻,给个人、社会造成恶劣的负面影响。
针对上述现象,丁凯表示,合合信息在文档图像内容安全领域已进行了深入的部署,研发了基于深度学习的图像篡改检测技术及相关系统,通过学习图像被篡改后统计特征的变化,该系统智能捕捉图像在篡改过程中留下的细微痕迹,可检测出复制粘贴、拼接、擦除等多种篡改形式,让人工智能准确识别出图片篡改的不同类型,并进行针对性的处理,提升识别精度和场景通用性。据悉,合合信息图像篡改检测技术已被银行、保险、制造业等多个行业引入。