我可以比图像的下采样二进制格使用哪些功能，手写OCR其他？(Which features can i

2019-10-17 07:14发布

您好我一直在寻找，虽然研究论文上哪些功能将是一件好事，我在我的手写OCR用神经网络进行分类。我是一个初学者，所以我一直只是把手写文字的图像，由它周围的边框，然后将其调整为15x20二值图像。因此，这意味着我具有300个特征的输入层。从我对谷歌找到的文件（这是很老的大部分）的方法确实有所不同。我的精度不坏的形象只是一个二进制格，但我想知道如果任何人有其他功能，我可以用它来提高我的准确度。甚至只是指着我正确的方向。我真的很感激！

谢谢，扎克

Answer 1:

我没有看到关于这个主题的实际文件，但我的建议是发挥创意。使用任何你能想到的，可能有助于分类识别号码。

我首先想到的是尝试和识别图像中“行”，也许通过修改“滑动窗口”算法（滑动/旋转行？），或试图确定一个“最佳拟合线”的图像（以有助于在italicism或写作风格）变化的响应分类。真的不过，如果您使用的是神经网络，应该对这些事情拿起没有你的帮助？（这是他们的整点！）

只有当你不能得到令人满意的表现一些其他的方式，我会首先关注你的网上，试图提高性能，并担心额外的功能，结构和布局。你也可以尝试提高你已经拥有的功能，确保字符图像中的中心，也许尝试的算法歪斜斜体字符，使它们垂直？

在我的经验，这些事情不会经常帮助，但你可以得到幸运，碰上一个提高你的净:)

文章来源: Which features can i use for handwritten OCR other than a downsampled binary grid of the image?