2024年 MathorCup 数学建模 B 题 甲骨文智能识别中原始拓片单字自动分割与识别研究 思路代码论文
第一问思路:首先,读取附件1中给定的三张甲骨文原始拓片图片。:将彩色图像转换为灰度图像,简化后续处理步骤。:使用图像去噪技术(如高斯滤波、中值滤波)去除图像中的噪声,提高后续处理的准确性。:应用边缘检测算法(如Canny边缘检测)突出甲骨文的边缘特征,有助于后续的分割。:根据甲骨文与背景的对比度,可以尝试简单阈值分割或更复杂的分割算法(如基于区域的分割、基于边缘的分割),将甲骨文与背景分离。:从分
问题1:图像预处理和特征提取。你可以尝试使用一些常见的图像预处理技术,如灰度化、二值化、去噪等,然后提取一些常见的图像特征,如边缘、纹理等。你也可以尝试使用深度学习模型,如卷积神经网络(CNN)来提取更高级的特征。
问题2:甲骨文图像分割模型。这可以采用深度学习模型,如FCN(全卷积网络)、U-Net等。你需要构建一个训练集,利用已标注的甲骨文原始拓片图像进行训练。然后,通过评估指标如准确率、召回率等来评估模型的性能。
问题3:对测试集中的图像进行分割。使用建立好的模型对测试集中的图像进行单字分割,并将结果记录在Excel文件中。
问题4:文字识别。你可以采用光学字符识别(OCR)技术,结合深度学习模型,如循环神经网络(RNN)或Transformer模型来实现。首先,你需要构建一个训练集,包含已标注的甲骨文字形,然后训练模型。最后,对测试集中的图像进行文字识别,并将结果呈现出来。
第一问思路
针对问题1,你可以按照以下步骤进行图像预处理和特征提取:
-
图像读取:首先,读取附件1中给定的三张甲骨文原始拓片图片。
-
灰度化:将彩色图像转换为灰度图像,简化后续处理步骤。
-
去噪:使用图像去噪技术(如高斯滤波、中值滤波)去除图像中的噪声,提高后续处理的准确性。
-
边缘检测:应用边缘检测算法(如Canny边缘检测)突出甲骨文的边缘特征,有助于后续的分割。
-
图像分割:根据甲骨文与背景的对比度,可以尝试简单阈值分割或更复杂的分割算法(如基于区域的分割、基于边缘的分割),将甲骨文与背景分离。
-
特征提取:从分割后的甲骨文图像中提取特征,可以考虑使用传统的图像特征(如形状、纹理特征)或者使用深度学习模型提取特征。
-
建立预处理模型:根据提取的特征,建立预处理模型,用于初步判别和处理甲骨文图像的干扰元素。
下面是一个Python示例代码,演示了如何进行简单的图像预处理和特征提取:
import cv2
import numpy as np
# 读取图像
image_paths = ["path_to_image1.jpg", "path_to_image2.jpg", "path_to_image3.jpg"]
images = [cv2.imread(image_path) for image_path in image_paths]
# 灰度化
gray_images = [cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) for image in images]
# 去噪
denoised_images = [cv2.GaussianBlur(gray_image, (5, 5), 0) for gray_image in gray_images]
# 边缘检测
edges = [cv2.Canny(denoised_image, 50, 150) for denoised_image in denoised_images]
# 显示结果
for i in range(len(images)):
cv2.imshow('Original Image', images[i])
cv2.imshow('Edge Detected Image', edges[i])
cv2.waitKey(0)
cv2.destroyAllWindows()
更多详细思路:2024 MathorCup 数学建模BCD 笔记、思路和代码(持续更新中)
甲骨文是我国目前已知的最早成熟的文字系统,它是一种刻在龟甲或兽骨上的古老文字。甲骨文具有极其重要的研究价值,不仅对中国文明的起源具有重要意义,也对世界文明的研究有着深远影响。在我国政府的大力推动下,甲骨文研究已经进入一个全新的发展阶段。人工智能和大数据
技术被应用于甲骨文全息性研究及数字化工程建设,成为甲骨文信息处理领域的研究热点[1]。
甲骨文拓片图像分割是甲骨文数字化工程的基础问题,其目的是利用数字图像处理和计算机视觉技术,在甲骨文原始拓片图像的复杂背景中提取出特征分明且互不交叠的独立文字区域。它是甲骨文字修复、字形复原与建模、文字识别、拓片缀合等处理的技术基础[2]。然而,甲骨拓片图像分割往往受到点状噪声、人工纹理和固有纹理三类干扰元素的严重影响[3]。且甲骨文图像来源广泛,包括拓片、拍照、扫描、临摹等,不同的图像来源,其干扰元素的影响是不同的。由于缺乏对甲骨文字及其干扰元素的形态先验特征的特殊考量,通用的代表性图像分割方法目前尚不能对甲骨文原始拓片图像中的文字目标和点状噪声、人工纹理、固有纹理进行有效判别,其误分割率较高,在处理甲骨拓片图像时均有一定局限性。如何从干扰众多的复杂背景中准确地分割出独立文字区域,仍然是一个亟待解决的具有挑战性的问题。图1为一张甲骨文原始拓片的图像分割示例,左图为一整张甲骨文原始拓片,右图即为利用图像分割算法[4]实现的拓片图像上甲骨文的单字分割。甲骨文的同一个字会有很多异体字,这无疑增加了甲骨文识别的难度图2展示了甲骨文中“人”字的不同异体字。
问题1:对于附件1(Pre test 文件夹)给定的三张甲骨文原始拓片图片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题 2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割,并从不同维度进行模型评估。其中附件2(Train 文件夹)为已标注分割的数据集。
问题3:利用建立的甲骨文图像分割模型对附件3(Test文件夹)中的200张甲骨文原始拓片图像进行自动单字分割,并将分割结果放在“Test results.xlsx”中,此文件单独上传至竞赛平台。
问题 4:基于前三问对甲骨文原始拓片图像的单字分割研究,请采用合适的方法进行甲骨文原始拓片的文字识别,附件4(Recognize 文件夹)中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资料,如使用外部资料需在论文中注明来源),请对测试集中的 50 张甲骨文原始拓片图像进行文字自动识别,并以适当结果呈现
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)