合合信息亮相PRCV大会，探讨生成式AI时代的内容安全与系统构建加速

在人工智能技术的飞速发展下，生成式AI已经成为推动社会进步的重要力量。然而，随着技术的不断进步，内容安全问题也日益凸显。如何确保在享受AI带来的便利的同时，保障信息的真实性和安全性，已经成为整个行业待解决的问题。

程序猿追

15427人浏览 · 2024-10-24 23:23:57

程序猿追 · 2024-10-24 23:23:57 发布

一、前言

近期，中国模式识别与计算机视觉大会（PRCV）盛大开幕。作为AI领域的年度盛会，共同探讨AI技术的最新进展和未来趋势。

在这次大会上，合合信息图像算法研发总监郭丰俊博士带来了一场主题为《生成式AI时代的内容安全与系统构建加速》的精彩演讲，深入探讨篡改检测技术的最新进展，分享如何通过创新的方法和工具，有效识别和防范篡改内容，保护数字世界的诚信与安全。

二、AI时代的新挑战

生成式 AI 的出现，标志着人工智能技术进入了一个全新的发展阶段。它能够通过学习大量的数据，自动生成各种类型的内容，如文本、图像、音频和视频等。这种强大的生成能力为创意产业、教育、医疗等领域带来了无限的可能性。

然而，生成式 AI 的广泛应用也带来了一系列的弊端。其中，内容安全问题成为了人们关注的焦点。由于生成式 AI 可以轻松地生成大量的内容，这就使得虚假信息、篡改内容等问题变得更加容易出现。如果不加以有效的监管和检测，这些问题将对社会造成极大的危害。

三、内容安全的守护者

为了应对生成式 AI 带来的内容安全挑战，合合信息提出了篡改检测技术。通过捕捉图像在篡改过程中留下的细微痕迹，在保持极低误检率的同时，准确识别并定位图片中文本的篡改行为；面对生成式图像造假，也可基于空域与频域关系建模，利用多维度特征以鉴别图像是否由 AI 生成，并给出相应的警告或提示。

1、图像篡改检测

图像检测技术是计算机视觉领域的关键技术。它主要是利用计算机算法来分析图像，识别其中的目标物体、特征或者异常情况。

从技术原理来讲，传统方法包括基于手工特征的检测，像利用 SIFT（尺度不变特征变换）等提取特征后进行匹配。如今，深度学习方法占据主流，如卷积神经网络（CNN）。以目标检测为例，Faster - RCNN 等模型通过区域生成网络和分类网络，能够精准定位和识别多种物体。

这项技术应用广泛，在安防领域可用于监控视频中的可疑人员检测，在工业上可以检测产品质量缺陷等诸多场景，为自动化处理提供了重要支持。

在商业活动和社会管理中，文档和证照起着至关重要的作用。然而，随着生成式 AI 技术的发展，伪造文档和证照的现象也越来越多。

伪造文档、证照检测技术可以有效地识别出伪造的文档和证照，维护社会的信任基石。这项技术可以应用于政府部门、企业、金融机构等多个领域。

在政府部门，伪造文档、证照检测可以防止非法活动，保障公共安全。在企业中，它可以防止商业欺诈，保护企业的利益。在金融机构中，它可以防止金融诈骗，保护客户的财产安全。

合合信息在伪造文档检测、证照检测方面也有着丰富的经验和先进的技术。他们的解决方案能够快速、准确地检测出伪造的文档和证照，为用户提供可靠的保障。

举个例子，例如，在银行移动开户、信用卡申办、以及商业消费等场景中，每年都会因欺诈带来风险。

其中，身份信息核查是银行、保险等业务场景中的首要项巨大的资金损失与潜在风险。

这里打开通用篡改检测的网址，新用户先点击登录，完成之后，点击免费使用。

对于伪造的证件，直接可以检测出被篡改的地方。

当然应用场景不止是证件检测，还有证卡证、证书、票据、扫描文档、文档印章、截图六类检测，并且具有广泛的适用性与优化的误检率控制（低误检-高检出）。

在财务审批过程中，对网约车订单、付款截图、航空行程单、酒店流水等各类报销佐证单据的真实性检验是一项重要任务。

商场小票是消费者经手的常见票据之一。大量商场都设有以消费金额换取积分，并兑换抵扣券、停车时限或是价值较高的礼品等福利，尤其部分大型集团连锁商场常以活动丰富知名。

2、伪造人脸图像检测

人脸检测是一种计算机视觉技术，用于在图像或视频中定位人脸的位置。它通过分析图像中的像素特征，如颜色、纹理和形状等，来确定是否存在人脸。通常采用基于特征的方法或深度学习算法。特征方法提取人脸的特定特征，如眼睛、鼻子和嘴巴等，然后进行匹配。深度学习算法则通过大量的人脸数据进行训练，能够自动学习人脸的特征模式。

在金融领域，伪造人脸检测可以防止欺诈行为，保护用户的财产安全。在安防领域，它可以帮助警方识别犯罪嫌疑人，提高破案效率。在社交领域，它可以保护用户的隐私和安全，防止虚假身份的出现。

合合信息在伪造人脸图像检测方面也有着深入的研究和实践。他们的技术能够准确地识别出伪造人脸，为用户提供可靠的身份验证服务。

这里打开伪造人脸检测的网址，点击登录，然后免费使用。

四、TextIn 大模型加速器

大模型加速器是一种专门为提升大语言模型处理速度而设计的技术工具。它采用先进的硬件架构，如专用的图形处理单元（GPU）或张量处理单元（TPU），以并行计算的方式加速模型的训练和推理过程。通过优化算法和数据传输机制，减少计算时间和资源消耗。同时，大模型加速器还能对模型进行压缩和量化，在不显著降低性能的前提下减小模型尺寸，使其更易于部署在不同的硬件平台上，为大语言模型的广泛应用提供了有力支持。

文档识别与图像处理方面，能快速准确识别多种格式文档并转换为可编辑文本。采用先进技术，确保识别准确、图像质量提升。

格式转换高效精准，将任意格式文档（包括图片）转为 Markdown、表格、Json等格式，方便编辑与分享，且可优化调整转换后的文档。

通用文档解析强大，能提取各种文档中的多种信息并转换为可编辑文本，对复杂表格和特殊元素处理出色。

电子档解析和扫描档识别表现优异，快速准确处理电子档，将扫描档转换为电子文档，实现纸质文档数字化。

云服务综合体验好，速度快且稳定，可快速处理大规模文档任务，采用云服务集群架构确保服务可靠。

通用文档解析强大，其算法框架融合了深度学习、自然语言处理等先进技术。通过对文档进行多层次的分析，能够准确识别文字、表格、图像、公式、印章、流程图、目录树等各种元素。对于复杂的无线表、跨页表格，能够智能识别结构和内容，确保不漏检、不错检。对于页眉、页脚、公式等特殊元素，也能精准解析。