我可以比图像的下采样二进制格使用哪些功能,手写OCR其他?(Which features can i

2019-10-17 07:14发布

您好我一直在寻找,虽然研究论文上哪些功能将是一件好事,我在我的手写OCR用神经网络进行分类。 我是一个初学者,所以我一直只是把手写文字的图像,由它周围的边框,然后将其调整为15x20二值图像。 因此,这意味着我具有300个特征的输入层。 从我对谷歌找到的文件(这是很老的大部分)的方法确实有所不同。 我的精度不坏的形象只是一个二进制格,但我想知道如果任何人有其他功能,我可以用它来提高我的准确度。 甚至只是指着我正确的方向。 我真的很感激!

谢谢,扎克

Answer 1:

我没有看到关于这个主题的实际文件,但我的建议是发挥创意。 使用任何你能想到的,可能有助于分类识别号码。

我首先想到的是尝试和识别图像中“行”,也许通过修改“滑动窗口”算法(滑动/旋转行?),或试图确定一个“最佳拟合线”的图像(以有助于在italicism或写作风格)变化的响应分类。 真的不过,如果您使用的是神经网络,应该对这些事情拿起没有你的帮助?(这是他们的整点!)

只有当你不能得到令人满意的表现一些其他的方式,我会首先关注你的网上,试图提高性能,并担心额外的功能,结构和布局。 你也可以尝试提高你已经拥有的功能,确保字符图像中的中心,也许尝试的算法歪斜斜体字符,使它们垂直?

在我的经验,这些事情不会经常帮助,但你可以得到幸运,碰上一个提高你的净:)



文章来源: Which features can i use for handwritten OCR other than a downsampled binary grid of the image?