机器视觉是机械、运动、控制、光学、软件、算法于一体的交叉学科,对于学工科的人来说,机械、运动、控制都有一定的了解,对于软件、算法、光学不是很了解。一台设备,有一个到二个机械设计师或者结构工程师,那么这个角色就胜任了机械部分,有一个电气工程师,那么就胜任了控制部分了,再来一个视觉工程师,担当视觉软件开发部分,那么整套系统就构成一套机器视觉系统, 对我们视觉软件发来说,做好光学(相机、镜头、光源)的选择,软件框架设计好,算法的实现,就可以了。
从业多年,可以看到,机器视觉软件开发是跟机械、电气紧密相连的,从而,我见过很多机械、电气行业从业人员进行转行进入到视觉软件开发,直接的接触让很多电气、机械的同学想进入机器视觉软件开发领域,今天我来说说从零基础学习视觉软件开发的学习路径,需要学习哪些知识?
1. 图像基础知识
做这个行业,需要知道图像的基础知识,至少先在文字层面上进行学习,比如什么是灰度,什么是位图,什么是深度,什么是通道,什么是像素,什么是灰度,什么是滤波等等,在第一个阶段,不要去深挖各种理论,先在文字层面上理解这是什么意思即可,其实,对我们应用层开发来讲,机器视觉工程师讲究的是一个系统集成的能力,对工程工艺的理解,而不是深挖理论,术业有有专攻,第一阶段切勿对不理解的公式去深挖,不懂得跳过这个,后期循序渐进或者学习,不懂的也不会对你后期开发有多大的影响,至于书籍方面,可以推荐看数字图像处理(冈萨雷茨),对于初学的人来说,让你去看这本书是难免有点多,但我不能不介绍他, 你也可以去搜索相关的图像处理基础知识扫盲也可以,这个阶段有点像萌芽的意思。
2. 光学成像部分
光学成像部分,需要了解成像系统的选型,包括相机、镜头、光源,这三大件必不可少,在这里学习,如果每个三大件展开,又有很多的知识点,相机的种类、相机的选择、相机sensor尺寸、镜头种类、镜头选型、光源种类、光源选型等等,那么在这个阶段就是一个积累和总结的过程了,你一个时候记不到这么多,记到了你不用也会忘记,我当年实习是在实验室打光测试做了1个半月,至少在光源和镜头方面实验的都实验了,但还是很多不知道,也是在后期工作中用到了哪一块就深入的去了解了。
3. 编程语言学习
上位机编程语言,有两种选择,C#和C++开发语言的学习,初学入门,建议学习C#作为上位机开发首选,C#语言入门简单,一本《C#入门经典》即可,语法规则熟悉一周左右即可,界面开发可以使用Winform、WPF,熟悉界面库也就差不多一到二周的时间。
C++语言就不一样了,C++语言很复杂,知识点很多,在短时间内很难理解那么多知识点,并且哪怕有三五年C++编程经验的程序员,也不敢说对C++语言精通,我等只有“会使用”的地步了,C++界面开发库常见的有MFC,MFC稍微有点过气了,现在广泛使用的界面库是Qt,熟悉Qt界面库一周到二周,真正在项目中熟悉使用需要积累和通过项目的锤炼。
我当年的学习路径是在大学先学的C++,学的MFC做界面,看的是孙鑫的C++教学视频,我的第一个MFC+Halcon程序显示图像、结果显示就搞了我一周,然后我学习的C#,界面开发库使用Winform,WPF,出来工作后主要使用C++开发,有时候也会使用C#开发,大多数时候是两种语言都会涉及,Winformwpf做界面,算法层、通信层等会封装成C的接口。
4. 算法工具的学习
有哪些算法工具,我有文章介绍过,没看过的可以去看
机器视觉软件开发系列--机器视觉算法工具扫盲
如果你有了一定的图像处理基础,编程基础,你现在去看算法工具的学习,就相对会顺畅很多,算法工具推荐使用halcon,学了halcon,其他的算法工具学起来都很快,并且halcon能够解决机器视觉领域内所有简单、复杂的项目,而且会halcon算法的工资待遇会更高。
学习halcon也是有方法的,先要对halcon的总体算法功能有个了解,以及知道每个功能模块的应用例程的经典案例。 再就是halcon的基本数据格式,算子的参数输入输出表示方法,图像参数、控制参数,再了解halcon常用的一些算子功能,那么入门开发就可以了,要深入,需要通过项目经验案例来进行学习和深入,开始学习。
这一步也是每个视觉任务要解决的核心问题,所以这部分内容也是最重要的,花的时间也最多。
5. 项目代码演练
前面的几个步骤,你不一定需要根据顺序来完成,你可以直接从3、4跳到这里,那么这一步就很关键了,前面那些知识点是一个零散的知识,这一步是把所有化零为整的步骤,这一步也是很多人最头疼的地方,如果没有师傅带, 你自己摸索,那是比较困难,最好是找到项目源码,找到合适的有经验的师傅进行学习,最开始可以从流程简单的到中级到高级的步子学习,单相机单流程,你的软件流程就简单,如果是单相机多流程,多相机多流程,线程之间的交互,以及数据的融合,那就是比较高级的项目了,所以这也是有经验的工程师的重要之处。