基于深度学习的网络广告图像文本检测研究-毕业作品网站

介绍

目前, 这些词经常出现在广告图像中, 具有非常重要的信息。如何使计算机检测图像中的文本是计算机视觉领域的一个热点。图像中的文本受亮度、阴影、字体、大小、排列等各种因素的影响。准确定位文本区域对后续文本的提取和识别非常重要。随着网络的普及, 信息传播越来越依赖于互联网, 与传统广告相比, 网络广告传播速度快, 受众广, 价格低廉, 具有明显的优势。网络广告比传统广告更具互动性, 并且可以被定向到目标受众, 同时, 及时更新更快, 更灵活, 越来越注重业务, 尤其是信息产业相关公司, 如一些游戏大多使用互联网网站宣传, 通过图片等形式的广告制作大量的垃圾邮件, 这极大地影响了用户的正常使用。可根据用户浏览和表现不同形式的在线广告干扰, 精确、植入、文本链接、图片、动画和视频形式。在网络广告中, 广告图像由于其丰富而诱人的外观而引起了人们的广泛关注, 这些广告对企业的好处也影响着普通用户的正常使用, 同时也加重了商业图像搜索引擎检索。在诸如车牌提取等诸多具体应用中, 文本在自然场景识别和图像检索和非法文本的网络监控系统中检测到的图像中的网络环境净化, 文本定位是关键过程.在现代经济中, 广告业是一个高度独立的信息产业。在这一特殊行业中, 作为信息和广告载体的产物, 通过加强手段, 不断推动大量信息传递在社会经济生活各个领域, 商品经济与繁荣市场在促销中起着重要的作用。随着科学技术和信息技术的发展, 特别是计算机技术、网络技术和存储技术的发展, 多媒体信息数据在现代技术中得到了广泛的应用。采购和生产各种类型的。为了能够在广告信息中发现大量广告, 广告公司通常采用手动检测方法。手动通过网页广告图片, 标识图片中文本的内容。通过对广告数量的统计, 把这些信息的位置放到分析当前广告是否正确。广告公司在广告、广告方面可能会出现很大的差距。例如, 广告要求在版面的特定位置, 出现广告刷新频率和出现其他类型的广告。由于广告投放量大、范围广、内容复杂, 效率低, 成本高。针对广告图像中的文本检测问题, 提出了一种自动

检测在线广告图像检测。通过比较和识别给定的图像, 在所选页面中选择所需的图像。在所选的广告图片中, 我们需要广告文本的内容, 然后通过与文本库中的内容进行比较来识别文本的位置。由于广告中的文字可以由艺术作品处理, 所有被认可的文本都被选为选定的文字区域。

深度学习与受限玻尔兹曼机

深度学习. 深度学习的概念来源于人工神经网络的研究。多层隐层感知器是一种深层次的学习结构。深入学习中, 通过将低级特征组合在一起, 形成了更抽象的属性类别或特征的高层次表示。2006年, 韩丁提出了深入学习的概念。提出了一种基于深置信网络的无监督训练算法, 为解决深部结构优化问题带来了希望。此外, 还提出了卷积神经网络。它是第一个真正的多层结构学习算法, 它利用空间相关关系减少参数个数, 提高训练性能。深入学习是一种新的机器学习领域, 研究的动机是建立和模拟人脑分析神经网络学习机制, 它模仿人脑对图像、声音和文本等数据进行解释。在许多情况下, 深度都足以表示任何具有给定目标精度的函数。但是, 价格是图表中的节点数可能变得非常大。理论结果证实了一个事实, 即需要用输入的大小成倍增长的节点数。我们可以把深度结构看成是一个分解。大多数随机选择的函数不能有效地表示, 无论是深的还是浅的体系结构。然而, 许多可以有效地表达的深度的结构不能用来表达的效果, 浅层建筑。存在一个紧凑和深的表示法意味着在函数中有一个可以表示的结构。如果没有结构, 就不可能推广得很好。

限制玻尔兹曼机. 受限玻尔兹曼机是玻尔兹曼机的一种特殊拓扑结构。玻尔兹曼机在统计物理中的起源原理是一种基于能量函数的建模方法, 可以描述玻尔兹曼机高阶学习算法的变量之间的相互作用非常复杂, 但模型和学习算法的物理解释, 更完整和严格的数理统计理论基础。玻尔兹曼机是一种对称随机反馈型耦合二值单元神经网络, 由可见层和多个隐层节点组成, 网络分为可见单元和隐藏单元, 具有可见单位和隐藏单元, 可表达随机网络和随机环境的学习模式。受限玻尔兹曼机是一种可以学习输入数据集概率分布的随机生成神经网络。深信任网络和深玻尔兹曼机, 由多层神经元组成。它已在许多机器学习任务中得到应用, 可以在一定程度上解决一些复杂的问题, 提高学习性能。深神经网络由若干受限玻尔兹曼机栈组成, 受限玻尔兹曼机中可见和隐藏神经元之间没有连接。基于层次无监督的贪婪前训练方法, 采用有限玻尔兹曼机对深神经网络进行训练。所得结果作为监督学习概率模型的初始值, 大大提高了学习性能。无监督特征学习是复杂层次结构和海量数据集的统计建模。通过无监督的前训练网络获得高阶抽象特征, 并提供了更好的初始权重, 权重定义在全局训练的有利范围内, 训练使用本地信息的层间分层, 重点放在训练数据本身的特点, 可以降低 overfitting 学习目标的风险, 避免累积误差的深层神经网络传输问题的长期存在。受限玻尔兹曼机由于结构单元的表示能力和容易推理已被成功地应用于神经网络的深度使用, 近年来受到了广泛的关注。作为一种实用的应用, 受限玻尔兹曼机学习算法具有优异的学习性能。受限玻尔兹曼机学习在深神经网络研究中占有核心地位。

基于有限玻尔兹曼机的网络广告图像文本检测算法

图像预处理. 在本文中, 我们需要对数字图像进行一系列预处理, 包括图像灰度变换两个值处理文本块定位和文本边缘检测等。我们将彩色图像转换为灰度像素只包含亮度信息, 以及在数字图像和其他噪声去除中冗余信息的背景, 从而为后续的文本分割和文本块提供方便。提取.数字图像文本提取与识别的噪声主要是由于光照因素、有效的图像信息导致色彩等因素的干扰而产生的噪声去除主要采用滤波方法, 包括均值滤波器和中值滤波, 对数字图像像素的噪声去除。背景和前景彩色图像的数字图像的灰度处理后, 分离, 灰色像素阈值的一般方法的分离, 包括全局阈值分离方法的局部阈值分离方法和动态可变阈值分离方法。由于动态门限分离方法的计算量大、效率低, 全局阈值法的分离效果较差。因此, 该算法采用局部最优阈值分离方法, 通过计算图像中不同像素的灰度梯度值的像素分离。该区域的两值图像处理特征, 通过差分变换, 检测出数字图像的灰度变化和纹理特征, 从而实现文本块和图像背景的分离。该算法利用一阶和两阶微分算子计算图像像素的灰度值, 实现不同区域的边缘检测。

层优化. 我们可以将原始数字图像的灰度图像分成若干层。由于数字图像的中心特征, 我们可以通过计算每个图像像素的距离来获得最终的图像层。在该算法中为了提高层的精度, 对层的选择过程, 第一层按照中心距离的大小分为两个子集的连通域分析操作, 使用像素噪声去除, 然后选择图像层的最小距离作为最终选择的结果, 该层包含在文本的提取和识别块中, 可以对其进行字符分割。本文以监督学习为指导。给定了 r 的训练集, 我们将它标记在训练集 r 包含3种图片样式。一个是文本自由图片 (标记为 0), 一个是包含图片的文本 (标记为-1), 另一个是仅包含文本的图片 (标记为 1)。然后采用双层受限玻尔兹曼机对训练集 R 样本的分布特性进行研究, 得到受限玻尔兹曼机的各节点参数和最小能量函数节点。在顶层, 我们使用分类器根据信息对图像样式进行分类。在双层结构中, 与单层有限玻尔兹曼机相比, 增强了受限玻尔兹曼机, 提高了泛化能力和分类精度。在训练的学习过程中, 目的是了解数据的特性, 得到最小的能量函数参数。

字词检测. 文本分割是从文本区域之外的文本中删除文本信息的过程, 然后将文本划分为一个具有单个字符的小区域。本文利用投影法和区域生成法提取文本区域中的字符, 用水平投影分割文本, 用区域生成法对文本进行分割。在5月阈值分割后获得的图像中还包含一些噪声像素, 获取分割结果也包括在像素部分不属于文本区域, 因此处理后删除这些噪声像素的需求。, 可以在最终文本图像识别后得到分割。目前, 光学字符识别技术得到了改进。对书写材料进行扫描和转换成计算机代码可以统一识别和存储取得了很大的成功。因此, 相关文献和绝大多数的 OCR 软件模块的使用已经商业化, 转换码字识别, 但由于低分辨率的文本区域和复杂的背景, 所以视频文本效果后, 两个数值和打印扫描二值化结果很大, 由于 OCR 系统的电流主要用于扫描打印文本, 所以识别效果不理想。为了解决这个问题, 我们可以采取两种程序, 传统的方案可以用来分割文本, 用对比的文字在图书馆比较的特点, 将识别单词和排序。提出了一种利用 OCR 深度学习的方法, 通过反复修改, 扩充了机器学习能力的内容。机器学习方法可以增加样本库的特征参数, 经过一段时间的学习机器可以自动识别文本内容。即使背景干扰, 经过一段时间的学习才能得到正确的结果。目前, 一些系统使用字典方法提高了识别效果, 取得了一定的效果, 但总的来说, 文本识别转换, 尤其是低分辨率文本图像识别, 仍需进一步研究, 以提高识别率。

结论

广告图像中的词语检测是非常有价值的。虽然人眼可以很容易地识别这些单词, 但这些单词的习得也面临着很大的困难。现有的工作对解决这些问题作出了有益的尝试, 并在一定程度上解决了问题。然而, 其结果仍远未得到实际应用, 需要国内外学者的协调努力。

参考文献

[1] Ye Dan, Zhou Jing. Research on Image Spam Text Area Detection Method [J]. Designing Techniques of Posts and Telecommunications, 2013(12): 76-79.

[2] Meng Li, Li Yuelong, Chen Gang. TV Advertisement Retrieval Based on Shot Change and Text Detection [J]. Journal of Jilin University (Science Edition), 2012, 50(6): 1185-1191.

[3] Wu Hui, Zhao Yuqian, Li Xianghua, Zou Beiji, Zou Runmin. Text detection from natural scene images based on color clustering [J]. Journal of Central South University (Science and Technology), 2015, 46(6): 2098-2103.

[4] Fei Mengyuan, Chuang Yuelong, Guo Wenping. Image text region detection based on Android [J]. Information Technology, 2016 (6): 103-106.

| 关于我们 | 友情链接 | 毕业设计招聘 |

Email：biyeshejiba@163.com 微信号：biyezuopinvvp QQ：1015083682
本站毕业设计和毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!