知道你也参与了人工智能的发展,并为人工智能的智能化做出了“卓越”的贡献吗?没错,就是正在看这篇文章的你!“人工智能”怎么就智能起来了呢?“学习”!人工智能是通过不断的学习,而变得越来越智能越来越聪明。它的学习资料是哪儿来的?你提供的!
我们都知道,人类在幼儿时,一开始你告诉他那是只小鸟,一次、两次告诉他,他记不住,然后父母就不厌其烦的一遍一遍的重复告诉他,时间久了,他就记住了,以此类推,虽然他记住东西名字所用的时间越来越短,但他所认识的世界万物都是这样经过不断重复的学习后,才认识了解的。
有一个事实,人类在遇到突发状况的时候,假如他没有“认知”,就是他没有听过、看过、经历过、思考过,那么他就会不知所措,无法一瞬间找出解决的办法。原因就是没有“学习”过。人类是经过无数次的重复“学习”,才获得了“知识”。人工智能也是如此。
假如偶有关注人工智能,我们就经常听到或看到一个词“数据挖掘”。哪来的数据?挖掘什么?为什么挖掘?这是问题的关键。
无疑,我们现在已完全进入了信息“大爆炸”的时代。充斥在我们身边的信息有时已成为了一种烦恼,没错,烦恼。笔者曾经因为要找一个“正经八本儿”的新闻APP,竟然用了两天的空余时间!在移动端下载了卸载,卸载了再下载,很难选出一个合适的。
可这种信息的充斥,却给了人工智能绝佳的“修炼”环境。
“数据挖掘”,就是从大规模的数据库中探究和分析,并从中找出对它有意义的模式和规则。
我们平时用手机或者用PC搜索知识、购物、浏览网页、或者去到某个地方会朋友,以及出差住宿、乘坐交通工具等等,凡是能和网络连接并用其所提供的服务,就是在为人工智能的发展提供“绵薄”之力,同时你也在享受着它提供的便利。
大数据是什么?
首先要厘清数据的来源,数据的主要来源是形形色色的企业、人和各种机器。以行业划分比如医院、电力、交通等等。只要是以数据的形式存储记录物或人的行为、规则、方式、过程、结果等,无论联网或者不联网,就是数据。
引自百度百科。大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
这个解释,只是说明了为什么是“大”和对“大”的解决利用办法。可也说明了“大数据”的目的性,提取、分析、优化,找到对某个行业或者某种场景利用价值的“数据”。
然后把找到的数据,提供给“人工智能机器人”,作为它们的“学习资料”。
举个例子,让智能机器认识并记住一直花猫。给它三只猫,一只黑色的,一只白色的,一只黑白花色的。你给它说,圆眼睛的是花猫。他会告诉你这几只都是花猫。然后,你告诉它圆眼睛、有黑颜色和白颜色的是花猫,它会告诉你,黑色的和白色以及黑白斑点的都是花猫。你再告诉它,圆眼睛和有黑色斑点和白色斑点的是花猫,它就会告诉你白色的和黑色都是花猫。你再告诉它圆眼睛、有黑色圆形斑点、有白色圆形斑点的而且在一直猫的身体上的是花猫,它就会正确指出哪只是花猫。
这几只猫就是大数据经过“数据挖掘”的算法后得出某个应用场景或某个企业想要得到的具有某种特征的结果“训练数据集”,这个过程就是机器学习,学习之后的认知结果体现在机器上就是人工智能。只不过智能机器的学习过程实际远比举的这个例子要复杂的多。
智能机器人就是通过这样不同的训练数据集,从而在里面利用各种学习(算法)找到一定的特征、规律,识别、总结出各种各样所需要的结果,然后运用到实际的场景应用中,为消费者、企业、社会组织提供不同的服务。
这里面,除了智能设备的运算支持外,“算法”起到核心的技术支撑作用。
用来反复学习的数据叫“训练数据集”;“训练数据集”中,一类数据区别于另一类数据的不同方面的属性或特质,叫“特征”;智能机器在“大脑”中总结规律的过程,叫“建模”;智能机器在“大脑”中总结出的规律,就是我们常说的“模型”;而智能机器通过反复“学习”总结出规律,然后学会的过程,就是“机器学习”。
通过人工智能专家持续的不懈努力,人工智能的“算法”也在很快的发展。人工智能的发展硬件和软件是一堆孪生兄弟,你追我赶。从“CPU”到“GPU”,从“大数据”到“训练数据集”、“深度学习”、“人工神经网络”,再到视觉识别、智慧医疗、智能制造等场景的应用,人工智能的“智能化”在不断的进化发展。