一、Hand-Written Chinese Characters Identification Input System(论文文献综述)
张莉,孟范泽,刘思霖,冯锐,王钢,蔡靖[1](2021)在《基于投影法和卷积神经网络的手写汉字图像分割研究》文中研究指明为提高手写汉字的识别率,针对手写汉字的有效分割,建立了卷积神经网络手写汉字体识别模型,并对投影法和轮廓检测法的适用性进行了对比分析。实验结果显示,相较于轮廓检测法,投影法更适用于手写汉字识别中对文字图像的处理工作,可以实现对所需文字的有效切分,同时简化手写汉字识别网络的设置并提高识别准确率。
肖雪,李成城[2](2022)在《手写汉字评价方法研究进展》文中研究表明手写汉字评价推动了计算机辅助教学的快速发展,如何通过手写汉字评价技术,在无教师帮助的情况下实现手写汉字的等级/规范性评价是当前研究的重点。对手写汉字评价相关概念以及发展趋势进行阐述;对手写汉字评价的不同研究方法进行详细介绍,包括基于规则、特征相似度计算、模糊矩阵以及机器学习等方面,并对各种方法的优缺点进行总结归纳;对手写汉字评价的反馈形式进行介绍,包括数据到文本生成、字形匹配与图形辅助等方面;分析手写汉字评价面临的多个问题,进一步思考其未来的发展。
管小卫,丁琳[3](2021)在《基于胶囊网络与深度置信网络融合模型的手写汉字识别》文中研究指明针对离线手写汉字的特征提取困难、不能准确识别等问题,提出了一种胶囊网络与深度置信网络的融合模型。首先从CASIA-HWDB1数据集中随机选择了一些文本分别训练胶囊网络和深度置信网络,然后采用胶囊网络和深度置信网络的融合策略进行了手写汉字识别实验。实验结果表明,在不确定方向上使用汉字融合模型的错误率降低了5.2%,与单独使用胶囊网络和深度置信网络相比,具有更好的识别效果。
周於川[4](2021)在《基于压缩模型的脱机手写汉字识别研究》文中研究表明
付博雅[5](2021)在《基于相似度特征和深度学习的脱机手写汉字评价与身份验证研究》文中研究说明
杨阳[6](2021)在《汉字草书文字识别方法研究》文中进行了进一步梳理随着国学研究日益“升温”,书法艺术的吸引力得到极大地的提升。草书艺术是我国特有的瑰宝,发现其艺术特征并促进其传承发展,可以将中华民族优秀的文化发扬光大。本文通过对汉字草书文字识别进行研究,促进了我国优秀文化的发展,更让“高大上”的书法艺术从殿堂走到民间,在大众普及中实现国民艺术素养的全面提升和传承,且本研究在多方面具有应用价值,能够助力书法、篆刻和考古等研究的发展。本文主要针对汉字草书文字识别的方法进行了探索,在研究过程中建立了标准草书文字数据库,开源后可为后续研究提供数据基础。在基于Hash算法的草书文字识别的研究过程中,提出相似距离用来衡量待识别草书文字与文字集之间的相似性,并且改进了相似距离的计算方式。经过实验得出,均值哈希、差异哈希和感知哈希三种方法都可以有效的对草书文字进行识别,但在文字图像经过旋转后,识别结果会受到较大的影响。在使用卷积神经网络进行草书文字识别的探索过程中,使用Res Net进行实验后对实验数据分析发现,Res Net-18与Res Net-50的验证集识别率都在95%以上,说明两种网络都能够很好的对草书文字进行识别,然后对数据集进行随机裁剪以及旋转,检验结果与未经裁剪和旋转的实验结果基本相似。实验结果表明基于卷积神经网络进行草书文字识别的方法在草书文字有干扰时,有更广泛的适用性。
甘吉[7](2021)在《手写文字识别及相关问题算法研究》文中研究指明作为信息表达和交流的重要工具,文字被广泛地应用于人们的日常生活和工作中。同时,手写也是每个人在社会中赖以生存的技能。随着计算机的发展和普及,手写文字识别作为一种高级的人机交互方式在近几十年来引起了人们的广泛关注。虽然研究者们在手写识别领域已经取得了大量突破性的进展,但是基于深度学习的手写识别算法仍然有很大的改进空间,因此如何设计更为准确高效的手写识别算法是本文的核心研究内容。另外,随着传感技术的发展,一种新型人机交互方式下的空中手写被提出,即用户可以直接使用手或手指在三维空间中自由地书写。然而,目前的空中手写识别研究仍然处于起步阶段,特别是针对空中手写中文文本识别的研究还处于一片空白。因此,空中手写识别也是本文的主要研究目标之一。本文主要的贡献总结如下:1.本文从一个全新的角度提出了一种基于一维卷积网络的联机手写汉字识别算法,即使用一维卷积网络直接对手写汉字轨迹的时序结构进行建模。本文提出的方法完全不同于目前主流的手写识别算法(包括基于二维卷积网络或循环神经网络的识别算法),并且具有显着的优势:(1)相比于二维卷积网络,提出的方法避免了经验化的领域知识来提取复杂的方向特征图,同时我们的模型参数更少且识别精度更高;(2)相比于循环神经网络,提出的方法能够并行地处理时序数据,其对于长序列手写轨迹的识别速度更快。2.本文提出了一种基于注意力机制的手写英文单词识别算法,该方法采用了编码-解码的架构并通过结合注意力机制迭代地输出目标字符串。同时,本文使用以下策略来进一步改进模型,包括:(1)我们使用一维卷积网络替代循环神经网络编码手写轨迹,显着地提升了模型的编码速度;(2)我们采用了词典约束的解码算法,显着地提升了模型的识别准确率。另外,我们构建了首个大规模的空中手写英文单词数据集IAHEW-UCAS2016用于促进后续的空中手写英文单词识别研究。最后,本文搭建了一个实用的空中手写英文单词识别系统。3.为了有效地识别联机手写中文文本,本文提出了一种新颖的时序卷积循环神经网络,其相比于现有的识别算法更具优势:(1)相比于主流的循环神经网络,提出的方法具有更快的计算速度和更高的识别准确率;(2)相比于最先进的全卷积循环网络,提出的方法避免了经验化的领域知识来提取复杂的特征图,同时模型的训练效率更高(包括更低的计算复杂度,更少的内存消耗,更快的收敛速度)且模型参数更少。为了进一步探究新型的空中手写,本文搭建了世界上首个三维空中手写中文文本识别系统。据我们所知,目前学术界还没有任何针对空中手写中文文本识别的研究。为此,我们构建并公开了首个大规模的空中手写中文文本数据集IAHCT-UCAS2018,从而促进后续的空中手写中文文本识别研究。4.本文提出了一种新颖的基于生成对抗网络的手写文本生成算法。现有的手写生成方法还没有完全地解决手写文本生成任务,因为它们都局限于生成较短的手写单词或者随机风格的手写文本图片。相反,本文提出的模型能够根据给定的任意文本生成任意长度的手写图片,其不局限于事先定义好的语料库或任何词汇表外的单词。同时,我们的模型能够从给定的参考样本中准确地提取出书写风格,从而进一步模仿生成具有相似风格的其它手写文本。实验分析表明本文提出的模型针对手写文本生成具有很好的泛化性,而不是单纯地记忆训练集中的真实手写样本。5.针对基于卷积神经网络的手写汉字识别模型,本文提出了新颖的一体化网络压缩算法。本文提出的压缩算法结合了通道裁剪和参数量化两种策略,能够在保证识别精度的前提下最大限度地压缩识别模型。具体地,在通道裁剪阶段,我们采用了粗细粒度相结合的裁剪策略来迭代地裁剪掉卷积网络中冗余的通道;在参数量化阶段,我们引入了权值丢弃和迭代式量化策略来最大限度地量化模型参数。在公开手写数据集(包括ICDAR-2013,IAHCC-UCAS2016,以及MNIST)上的实验结果表明提出的方法能够显着地压缩基于卷积神经网络的手写汉字识别模型。
王磊[8](2021)在《基于交互模式的手写体汉字采集与识别系统研究》文中研究说明随着科学技术的发展,模式识别的应用在人们的生活中产生着非常重要的影响。模式识别是人工智能发展的基础理论与方法,主要研究方法是应用计算机技术对识别的事件进行识别与分类,其中一个重要的应用领域就是手写体汉字识别。汉字的种类繁多、结构复杂、不同人的书写风格各不相同、形近字过度相似等因素为手写汉字的识别带来了极大的困难。模式识别技术的不断发展推动着AI技术的进步,其中AI技术主要包含机器学习和深度学习技术。深度学习的崛起,为汉字识别提供了强有力的技术支持,相对于传统的汉字识别技术,深度学习卷积神经网络非人工特征提取、端到端的学习技术有着十分显着的优势,因此深度学习技术正在逐渐代替传统识别方法。本文利用深度学习技术对手写汉字的识别进行了研究,具体研究工作如下:(1)设计了一款手写体汉字数据采集设备,该设备使用加有红光滤光片的摄像头,利用光流算法,采集一字线性激光器反射光斑的移动轨迹,将采集到的轨迹进行二值化处理,最终输出显示在自主开发的汉字识别软件上。(2)实验采用中国科学院自动化研究所CASIA-HWDB1.1手写汉字数据库,由于该数据库的原始数据图像略显模糊,以及为了更好地满足实验数据需求,因此需要对该数据库的图像数据进行预处理。数据预处理主要包括:增强对比度、灰度化、归一化、二值化、平滑去噪以及形态学处理等。采用增强图像对比度的方法,来增强图像像素的对比信息;采用加权平均算法进行灰度化处理;采用双三次插值算法进行图像尺寸归一化处理,从而将图像的边缘特征很好的保留下来;采用最大类间方差算法进行二值化处理,实现数据的前景和背景分割;采用中值滤波算法进行图像平滑去噪,很好的保留了手写汉字的特征信息;将中值滤波后的图像数据进行形态学操作,使得汉字的有效特征区域范围扩大。(3)基于Tensor Flow深度学习框架,采用Inception V3网络模型对数据进行迁移学习训练,通过多组对比实验,采用指数衰减学习率,确定出最优化算法以及适用网络模型,并采用数据增强以及参数优化策略方法,训练出最优网络模型。(4)采用Py Qt5的桌面应用开发技术,开发了一套手写体汉字识别人机交互界面,通过软、硬件相结合的方式,实现了人机交互的手写体汉字识别模式。
杜松波[9](2021)在《基于DHFS和DWFnet融合特征的古籍汉字图像检索》文中研究说明古籍汉字图像检索能够辅助古籍汉字研究人员在研究过程中高效追溯相似字形,是古籍汉字相关研究的有效工具。然而,古籍文献年代久远导致版面退化以及古籍汉字字形结构复杂、字体种类繁多等特点影响了古籍汉字图像检索的准确性,现有的文字图像检索与识别技术对古籍汉字图像难以达到理想的检索效果。因此,针对古籍汉字图像特点以及传统文字图像检索技术的不足,提出基于DHFS(Dual Hesitant Fuzzy sets,对偶犹豫模糊集)和DWFnet(Discrete Wavelet Fusion network,离散小波融合网络)融合特征的古籍汉字图像检索方法。通过引入对偶犹豫模糊集、离散小波融合网络和典型相关分析,提取融合结构特征和深度特征的古籍汉字图像检索特征,构建古籍汉字图像检索模型。主要工作有:(1)古籍汉字图像结构特征提取利用对偶犹豫模糊集能够更全面表达不确定信息的优势,将其引入古籍汉字方向线素网格特征提取过程,建立相邻网格对于当前网格的多属性评价指标及其相应的隶属度和非隶属度函数,并利用对偶犹豫模糊熵计算各属性的权重,使所提取的对偶犹豫模糊方向线素特征更充分体现了古籍汉字结构属性。实验结果表明,对偶犹豫模糊方向线素特征比其他人工特征更能表述古籍汉字的结构特征。(2)古籍汉字图像深度特征提取提出了基于离散小波融合网络的古籍汉字图像特征提取方法,利用离散小波变换将卷积神经网络的低层特征和高层特征有效融合,并通过金字塔弹性池化将融合特征图压缩为古籍汉字图像的特征向量,避免了传统的卷积神经网络仅利用高层特征进行分类,忽视了低层网络细节特征的问题。实验表明,DWFnet可以提取更具判别信息的多层融合特征,提高古籍汉字图像的检索性能。(3)基于DHFS和DWFnet融合特征的古籍汉字图像检索模型提出基于DHFS和DWFnet融合特征的古籍汉字图像检索模型。根据主成分分析法将DWFnet特征进行降维处理,利用典型相关分析将对偶犹豫模糊方向线素特征和DWFnet特征进行融合,建立基于多融合特征的古籍汉字图像检索模型。实验表明,融合特征比单一特征具有更强的表征能力,更适用于古籍汉字图像检索。
吴昌杰[10](2021)在《面向复杂结构文本识别的编解码模型研究》文中指出文本识别技术旨在从静态图片或者在线轨迹点中自动识别文本内容。一方面,文本识别和网络空间安全息息相关。该技术能够自动破解图片或者轨迹格式的验证码,检测图片中嵌入的暴恐信息和违法广告,识别交通车辆的车牌号码和身份证件号码等。另一方面,文本识别技术更是能够极大地提高人们的工作效率,促进社会经济发展。例如手写输入法、纸质文档电子化、拍照翻译和机器阅卷等应用给人们带来了极大的便利。复杂结构文本的是文本识别任务中的难点之一。不同于普通的文本行,复杂结构文中除了包含基本的文本符号外,还包含了多种空间关系。比如在数学公式中,被开方数在根号的内部,根指数位于根号的左上部。这些空间结构的存在,增加了文本表示的多样性,但也极大地提高了文本识别的难度。本文主要以汉字和公式为例,研究基于深度学习中编解码模型的复杂结构文本识别方法。本文从编码器的优化、注意力机制的改进和解码器的重构三个角度出发,以汉字和数学公式为例,来设计性能更好和鲁棒性更强的复杂结构文本识别模型:1.在编码器中结合空间变换网络,来改善编码器提取旋转或扭曲文本特征的能力,使得模型在识别旋转或扭曲文本时具有更好的鲁棒性。本工作以街景扭曲汉字识别为例,提出了结合空间的部首分析网络,该模型能够很好的纠正并识别旋转或扭曲的汉字。2.使用后验注意力机制来改进软注意力机制,提高模型学习输入和输出之间对齐的能力。我们以在线手写数学公式为例,提出了基于笔划级别后验注意力机制的编解码模型。后验注意力机制能够有效地改善模型输入和输出之间的对齐效果,并因此提高模型的识别性能。3.构建一个通用树形解码器,来解码任意能够转换成树形结构的文本,并提高模型在复杂结构文本上的泛化性。本工作提出了一个新型的树形解码器,该模型中的节点分类模块和分支预测模块能更直接地学习复杂结构文本中字符之间的空间关系。通过在数学公式和汉字上的大量实验,证明了新型树形解码器在面对复杂结构文本时,拥有更好的泛化能力和更高的性能。
二、Hand-Written Chinese Characters Identification Input System(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Hand-Written Chinese Characters Identification Input System(论文提纲范文)
(1)基于投影法和卷积神经网络的手写汉字图像分割研究(论文提纲范文)
0 引言 |
1 投影法 |
2 对比分析 |
2.1 基于CNN卷积神经网络的手写汉字识别模型 |
2.2 对比分析 |
3 结论 |
(2)手写汉字评价方法研究进展(论文提纲范文)
1 文献统计及相关概念 |
1.1 文献统计 |
1.2 书写质量评价相关概念和一般框架 |
1.2.1 即时评价 |
1.2.2 事后评价 |
1.3 评价指标 |
1.3.1 人工评价 |
1.3.2 自动评价 |
2 手写汉字评价方法 |
2.1 基于规则的方法 |
2.2 基于特征相似度计算的方法 |
2.3 基于模糊矩阵的方法 |
2.4 基于机器学习的方法 |
2.4.1 基于深度学习的方法 |
2.4.2 基于机器学习的其他方法 |
2.5 小结 |
3 反馈形式 |
3.1 数据到文本生成 |
3.2 字形匹配 |
3.3 图形辅助 |
4 问题与挑战 |
5 结束语 |
(3)基于胶囊网络与深度置信网络融合模型的手写汉字识别(论文提纲范文)
1 引言(Introduction) |
2 相关工作研究(Related Work Research) |
2.1 胶囊网络 |
2.2 深度置信网络 |
2.2.1 受限玻耳兹曼机(RBM) |
2.2.2 DBN模型的构建 |
2.3 Caps Net与DBN融合模型 |
3 仿真与测试(Simulation and Test) |
3.1 实验准备 |
3.2 实验结果与分析 |
4 结论(Conclusion) |
(6)汉字草书文字识别方法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景以及意义 |
1.2 国内外研究现状 |
1.3 研究难点 |
1.4 论文研究内容及论文章节安排 |
2 相关技术研究与理论基础 |
2.1 图片的Hash算法 |
2.1.1 哈希指纹 |
2.1.2 图片频率 |
2.1.3 均值哈希(Average hash,AH) |
2.1.4 差异哈希(Difference hash,DH) |
2.1.5 感知哈希(Perceptual hash,PH) |
2.2 汉明距离(Hamming distance) |
2.3 卷积神经网络介绍 |
2.3.1 神经网络 |
2.3.2 卷积神经网络(Convolutional Neural Network,CNN) |
2.4 图像预处理 |
2.4.1 图片灰度化 |
2.4.2 图像二值化(Binarization) |
2.4.3 去除图像水印 |
3 基于Hash算法的草书文字识别方法研究 |
3.1 数据集以及相似距离介绍 |
3.1.1 数据集介绍 |
3.1.2 相似距离定义 |
3.2 数据预处理 |
3.3 多种哈希算法在草书识别中的应用 |
3.3.1 均值哈希在草书文字识别的应用 |
3.3.2 感知哈希在草书文字识别的应用 |
3.3.3 基于差异哈希算法的草书文字识别 |
3.3.4 Hash各算法相似距离比较 |
3.4 多种哈希算法性能比较 |
3.5 字体图像缩放对各哈希算法影响 |
3.6 图像旋转对各哈希算法的影响 |
3.7 本章小结 |
4 基于卷积神经网络的草书文字识别 |
4.1 Rest Net简介 |
4.2 基于Res Net的草书文字识别 |
4.2.1 实验设计 |
4.2.2 实验数据集 |
4.2.3 实验结果 |
4.3 图形裁剪以及旋转对Res Net识别率影响 |
4.4 迭代次数对草书文字识别正确率的影响 |
4.5 本章小结 |
5 总结 |
5.1 本文主要工作总结 |
5.2 未来工作展望 |
参考文献 |
攻读硕士学位期间发表的论文及所取得的研究成果 |
致谢 |
(7)手写文字识别及相关问题算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 手写识别发展现状 |
1.2.2 相关问题的发展现状 |
1.3 主要研究内容及创新点 |
1.4 论文组织结构 |
第2章 基于一维卷积的联机手写汉字识别 |
2.1 引言 |
2.2 基于一维卷积的联机手写汉字识别算法 |
2.2.1 手写轨迹预处理 |
2.2.2 基于1D-CNN的手写识别架构 |
2.3 实验结果 |
2.3.1 数据集设置 |
2.3.2 不同配置下1D-CNN的识别结果 |
2.3.3 1D-CNN与RNN之间的比较 |
2.3.4 各种策略的消融实验分析 |
2.3.5 在公开数据集上的最终性能比较 |
2.4 结论 |
第3章 基于注意力机制的空中手写英文单词识别 |
3.1 引言 |
3.2 空中手写英文单词数据集 |
3.2.1 空中手写英文单词的样本采集 |
3.2.2 空中手写英文单词的特点 |
3.3 基于注意力机制的手写单词识别算法 |
3.3.1 空中手写英文单词预处理 |
3.3.2 基于注意力机制的编码-解码识别架构 |
3.4 实验结果 |
3.4.1 实验配置细节 |
3.4.2 词典约束解码策略的性能分析 |
3.4.3 注意力机制的可视化分析 |
3.4.4 用户独立性实验分析 |
3.4.5 识别模型的消融实验分析 |
3.4.6 与其它空中手写英文单词识别工作的比较 |
3.4.7 不同方法的最终识别准确率比较 |
3.4.8 识别案例分析 |
3.5 结论 |
第4章 基于时序卷积循序网络的空中手写中文文本识别 |
4.1 引言 |
4.2 空中手写中文文本数据集 |
4.2.1 空中手写中文文本的样本采集 |
4.2.2 空中手写中文文本的特点 |
4.3 基于时序卷积循环网络的手写文本识别算法 |
4.3.1 空中手写中文文本预处理 |
4.3.2 基于时序卷积循环网络的识别架构 |
4.4 实验结果 |
4.4.1 实验配置细节 |
4.4.2 模型的整体性能评估 |
4.4.3 消融实验分析 |
4.4.4 与基于神经网络的主流识别方法比较 |
4.4.5 不同方法在公开数据集上的最终性能比较 |
4.4.6 错误案例分析 |
4.5 结论 |
第5章 基于生成对抗网络的手写文本生成 |
5.1 引言 |
5.2 基于生成对抗网络的手写文本生成算法 |
5.2.1 HiGAN的框架 |
5.2.2 训练损失函数 |
5.3 实验结果 |
5.3.1 实验配置细节 |
5.3.2 手写文本生成效果 |
5.3.3 模型的鲁棒性分析 |
5.3.4 与现有的GAN方法比较 |
5.3.5 使用GAN提升手写识别性能 |
5.4 结论 |
第6章 基于卷积神经网络的手写汉字识别模型压缩 |
6.1 引言 |
6.2 基于卷积神经网络的手写汉字识别模型压缩算法 |
6.2.1 相关知识介绍 |
6.2.2 二维卷积神经网络的一体化压缩方法 |
6.2.3 提出方法与前人工作的比较优势 |
6.3 实验结果 |
6.3.1 实验配置细节 |
6.3.2 通道裁剪性能评估 |
6.3.3 参数量化性能评估 |
6.3.4 整体压缩算法性能 |
6.3.5 错误案例分析 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(8)基于交互模式的手写体汉字采集与识别系统研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 手写体汉字识别的难点分析 |
1.4 本文研究内容 |
1.5 论文结构安排 |
1.6 本章小结 |
第2章 深度学习与卷积神经网络 |
2.1 深度学习技术发展现状 |
2.1.1 自动编码器 |
2.1.2 受限玻尔兹曼机 |
2.2 卷积神经网络 |
2.2.1 卷积神经网络结构 |
2.2.2 卷积神经网络优化方法 |
2.3 本章小结 |
第3章 硬件设计与实现 |
3.1 硬件设计 |
3.1.1 硬件设备信息 |
3.1.2 硬件设备搭建 |
3.2 基于光流算法的数据采集 |
3.2.1 光流算法 |
3.2.2 LK光流算法原理 |
3.3 本章小结 |
第4章 手写体汉字识别 |
4.1 数据集 |
4.2 图像预处理 |
4.2.1 灰度化 |
4.2.2 归一化 |
4.2.3 二值化 |
4.2.4 去噪处理 |
4.2.5 形态学处理 |
4.3 手写体汉字识别软件设计 |
4.3.1 开发语言及开发平台 |
4.3.2 PyQt5 |
4.3.3 软件模块设计 |
4.3.3.1 软件启动模块 |
4.3.3.2 数据选择模块 |
4.3.3.3 数据预处理可视化模块 |
4.3.3.4 模型调用模块 |
4.3.3.5 鼠标书写模块 |
4.3.3.6 光斑轨迹采集模块 |
4.3.3.7 识别输出模块 |
4.4 本章小结 |
第5章 实验与分析 |
5.1 网络模型 |
5.2 训练模型 |
5.3 手写体汉字识别系统 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介 |
攻读硕士学位期间研究成果 |
(9)基于DHFS和DWFnet融合特征的古籍汉字图像检索(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 图像检索技术 |
1.2.2 汉字图像特征提取技术 |
1.2.3 对偶犹豫模糊集 |
1.3 主要工作 |
1.4 组织结构 |
第二章 古籍汉字图像结构特征提取 |
2.1 古籍汉字图像预处理 |
2.1.1 古籍文献版面图像二值化 |
2.1.2 古籍文献版面图像格线去除 |
2.1.3 古籍文献版面图像切分 |
2.2 对偶犹豫模糊方向线素特征提取 |
2.2.1 相关概念 |
2.2.2 古籍汉字图像的弹性网格划分 |
2.2.3 对偶犹豫模糊属性指标设定 |
2.2.4 属性指标权重确定 |
2.2.5 对偶犹豫模糊方向线素 |
2.3 基于对偶犹豫模糊方向线素的古籍汉字图像检索模型 |
2.3.1 相似性度量 |
2.3.2 古籍汉字图像检索模型 |
2.4 实验结果与分析 |
2.4.1 实验环境与数据集 |
2.4.2 实验参数与评价指标 |
2.4.3 检索性能分析 |
2.5 本章小结 |
第三章 古籍汉字图像深度特征提取 |
3.1 离散小波融合网络 |
3.1.1 卷积神经网络基本结构 |
3.1.2 离散小波融合网络的整体框架 |
3.1.3 多层特征融合模块 |
3.1.4 金字塔弹性池化 |
3.2 基于DWFnet的古籍汉字图像检索模型 |
3.3 实验结果与分析 |
3.3.1 实验环境与数据集 |
3.3.2 实验参数 |
3.3.3 检索性能分析 |
3.4 本章小结 |
第四章 基于DHFS和 DWFnet融合特征的古籍汉字图像检索模型 |
4.1 古籍汉字图像特征降维 |
4.2 古籍汉字图像特征融合 |
4.2.1 CCA的基本思想 |
4.2.2 特征融合算法 |
4.3 基于融合特征的古籍汉字图像检索 |
4.4 实验结果与分析 |
4.4.1 实验环境与数据集 |
4.4.2 实验参数 |
4.4.3 检索性能分析 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
致谢 |
攻读学位期间取得的科研成果 |
(10)面向复杂结构文本识别的编解码模型研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 汉字识别研究概况 |
1.2.2 数学公式识别研究概况 |
1.3 出发点与研究梗概 |
1.4 研究方法与思路 |
1.4.1 基于结合空间和部首分析的扭曲文字识别 |
1.4.2 基于笔划后验注意力的在线手写数学公式识别 |
1.4.3 基于树形结构解码器的复杂结构文本识别 |
1.5 主要创新点 |
1.6 论文结构安排 |
第2章 基于结合空间和部首分析的扭曲文字识别 |
2.1 研究概述 |
2.2 结合空间和部首分析网络框架 |
2.2.1 基于空间变换的编码器 |
2.2.2 基于空间注意力机制的解码器 |
2.3 实验 |
2.3.1 训练和测试细节 |
2.3.2 识别旋转汉字的可视化 |
2.3.3 旋转汉字的实验 |
2.3.4 空间变换机制与部首分析网络的互补性 |
2.3.5 自然场景下汉字识别实验 |
2.4 本章总结 |
第3章 基于笔划后验注意力的在线手写数学公式识别 |
3.1 研究概述 |
3.2 基于笔划后验注意力机制模型框架 |
3.2.1 编解码模型 |
3.2.2 笔划平均池化层 |
3.2.3 基于后验注意力机制的解码器 |
3.3 实验 |
3.3.1 数据集 |
3.3.2 训练和推理细节 |
3.3.3 后验注意力机制的评估 |
3.3.4 注意力可视化 |
3.3.5 注意力监督消融实验 |
3.3.6 与其他模型比较 |
3.4 本章总结 |
第4章 基于树形解码器的结构文本识别网络 |
4.1 研究概述 |
4.2 树形解码器模型框架 |
4.2.1 数学表达式和汉字的树形结构表达 |
4.2.2 整体框架 |
4.2.3 编码器 |
4.2.4 树形解码器 |
4.2.5 增加“思考”步骤 |
4.2.6 像素级别的辅助分类 |
4.3 实验细节 |
4.3.1 训练配置 |
4.3.2 数据集 |
4.4 实验结果 |
4.4.1 新型解码器的乱序训练和识别 |
4.4.2 消融实验和可视化分析 |
4.4.3 泛化性实验 |
4.4.4 与其他主流方法比较 |
4.4.5 未见过汉字的识别实验 |
4.5 本章总结 |
第5章 总结 |
5.1 研究工作总结 |
5.2 研究工作展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
四、Hand-Written Chinese Characters Identification Input System(论文参考文献)
- [1]基于投影法和卷积神经网络的手写汉字图像分割研究[J]. 张莉,孟范泽,刘思霖,冯锐,王钢,蔡靖. 电子技术应用, 2021(11)
- [2]手写汉字评价方法研究进展[J]. 肖雪,李成城. 计算机工程与应用, 2022(02)
- [3]基于胶囊网络与深度置信网络融合模型的手写汉字识别[J]. 管小卫,丁琳. 软件工程, 2021(10)
- [4]基于压缩模型的脱机手写汉字识别研究[D]. 周於川. 重庆邮电大学, 2021
- [5]基于相似度特征和深度学习的脱机手写汉字评价与身份验证研究[D]. 付博雅. 燕山大学, 2021
- [6]汉字草书文字识别方法研究[D]. 杨阳. 中北大学, 2021(09)
- [7]手写文字识别及相关问题算法研究[D]. 甘吉. 中国科学院大学(中国科学院计算机科学与技术学院), 2021(01)
- [8]基于交互模式的手写体汉字采集与识别系统研究[D]. 王磊. 长春大学, 2021
- [9]基于DHFS和DWFnet融合特征的古籍汉字图像检索[D]. 杜松波. 河北大学, 2021(09)
- [10]面向复杂结构文本识别的编解码模型研究[D]. 吴昌杰. 中国科学技术大学, 2021(09)