坊间流传着这么一个说法:谷歌想回中国,必须靠AI;而靠AI回中国,必须搞个大事情。于是,上周四的晚上李飞飞发布了一篇博客,然后连着发了三条推特,宣布一个叫AutoML的AI产品启动了。
一夜之间,中国的科技媒体就爆炸了,空气中似乎回荡着那一句话:搞事情了搞事情了搞事情了……
AutoML到底是不是跟谷歌的中国战略有关,我们不做讨论。这里希望帮大家搞清楚的,是这个AutoML到底要搞什么事情。
按照谷歌云AI项目首席科学家李飞飞的说法,AutoML的目标是降低开发者、研究者和企业群体使用人工智能相关工具和框架的门槛。而通俗的理解大概就是,这个产品可以不用写一行代码,就训练出一个企业级的机器学习模型。AutoML也就是“自动机器学习”的意思。
惊不惊喜?意不意外?
传说中学会机器学习年入50万起呢?说好的BAT疯抢AI工程师呢?是不是感觉刚掏出去的培训费被风吹走了?
更有网友惊奇地评论道:不是说一起用AI去革一大堆工作的命吗?怎么我辛辛苦苦学AI结果先被革命了?
当然了,现实并没有这么残酷。但谷歌的动作并不是孤例,背后隐含着的,是一直被反复提及的“AI民主化”。并且也确实折射出“我们今天学的AI也许是没用的”这种可能。
让我们从这个“谷歌大动作”来一点点说起。
搞笑的吧?原来最先被AI革命的是AI工程师?
谷歌放出的这个让代码界风声鹤唳的东西,叫做AutoML Vision.是整个AutoML体系的第一款产品,专注自动生产图像识别领域的模型。
我们用简单易懂的方式描述一下这个系统是如何工作的吧:
假如以前我想要做一个能够进行图像识别的AI系统,那么我需要在开发框架上自己搭建训练过程,完成各种训练部署,导入数据集,整个过程需要使用编程的方式来完成。
但在AutoML Vision上,我就一行代码都不用写,只需要按照说明,把我希望训练用的图片都拖进系统里,然后耐心等待,一个训练好的机器学习模型就趁热出炉了。
举个例子,假如你想训练一个模型,用来识别你家的猫主子是不是生气了(这得有多无聊……),那么就只需要在AutoML Vision拖入你家猫的照片、它生气时候的照片、高兴时候的照片等等等等,然后你就会得到一个识别程序。用它连上手机拍照,就可以让AI去理解猫大人的喜怒哀乐了。
是不是挺神的?
(AutoML Vision拖放图片界面)(AutoML Vision拖放图片界面)
这背后,是谷歌利用了深度学习领域中的迁移学习(Transfer Learning)技术。把此前谷歌训练图像识别模型时积累下来的训练过程,迁移到AutoML当中,这样就节省下来了后续类似模型的开发过程。
简单来说,AutoML有点像谷歌云搭建的一个“解题公式”。之后的考生并不需要知道公式是怎么来的,只需要把问题套进去就可以得到答案。当然了,这只是简单交代一下它的工作原理,实际上没有那么容易。尤其在调试进程中,不同模型需求和系统的兼容度是个大问题。
总而言之,这个产品以及背后的思路,对于想做机器学习又缺乏专业技术和人才的企业来说确实是个福音。它取消的,是通过代码搭建机器学习模型的过程,以及复杂的调试工作。仅保留了输入特定数据这件事给用户。很大程度上降低了机器学习训练中的工作量,尤其是编程工作。
但也别太乐观。虽然AutoML目前还没有正式发布,真实效果有待考量,使用价格也是未知数。但就目前信息来看,AutoML生成定制化模型需要的数据量还是很大。不是毫无基础的开发者能够搞定的。
而且它只能完成相对简单的任务,且只能套用谷歌给出的训练方案。如果想要制作比较复杂的机器学习系统,使用独特算法进行训练,那么编程还是不可避免的。
所以呢,目前来看真正用心且努力进入AI开发领域的朋友大可放心。只懂个大概想要快速转行AI骗高薪的朋友,那就期待老板比你更不懂吧…
除了图像识别,谷歌未来还计划将AutoML服务拓展到翻译、视频和自然语言处理等领域。这或许意味着初级的AI程序被自动生成、快速复制到各行业已经不远了。
虽然谷歌表示AutoML是目前唯一一个此类产品,但其实各家也都在部署类似的业务。比如亚马逊的Amazon SageMaker,以及微软还未正式发布的定制图像识别模型服务。包括国内的百度,也在旗下AI开放平中推出过定制化图像开放平台。
谷歌这次之所以被称为“搞了个大事”,主要是因为目前来看AutoML的自动化程度更高,尤其是解决了自动搭建训练模型和调参这两大问题。
在谷歌这么卖力的背后,似乎写着五个大字:AI民主化…
AI民主化,要取消了谁的集权?
去年3月,刚刚加盟谷歌不久的李飞飞就表示,人工智能的下一步是完成“AI民主化”。在这次发布AutoML之后,她又一次表示由于资源稀缺,多数企业无法开发个性化模型,所以AutoML的出现是为了进一步推进AI民主化。
那么问题来了:AI民主,到底是针对谁的专政?要取消谁的集权?
有人说了,AI现在是掌握在几家大公司手里的。AI民主当然是要让人人成为AI的主人,破解巨头专政。
我只能说,你当人家傻啊?
难道谷歌们会费了好大力气,为了瓦解自己的霸权?当然不会。就像AutoML的产品思路中展示的那样,省略掉了开发者的技术门槛,谷歌从中吃亏了吗?没有。谷歌拥有了更多的用户,自身的算法优势无形中得到了扩张。并且AutoML的用户训练模型是要直接部署在谷歌云上的,显然这也是个变相捆绑,希望从刁钻角度刺AWS几刀。
对于最迫切希望得到“民主”的小公司和个人开发者而言,巨头兜售的开发者赋能和去技术门槛式“民主”,绝不是仁慈的馈赠,而是换取小开发者紧密依赖关系的生态交换。真正被所谓AI民主瓦解的,其实是夹在大公司和小开发者之间的中层公司,或者叫算法公司、技术公司。
目前在世界各地的AI市场上,这类中型公司都普遍存在。当然其存在是有意义和价值的。对于巨头来讲,将技术能力打入各行各业,开发各种各样的应用是完全不可能的,那么就有赖于开发者去做这些事,自己做平台服务和技术能力的输出者就好了。
但小团队和个人开发者能去做这些深入行业,或者极具创意的开发吗?答案是也不行,因为从头开始的技术太复杂,对人才的需求太高。一般开发者和小企业根本玩不起。
于是就出现了大量夹层公司,他们以技术壁垒为主要产业支撑点。利用重技术和人才去做一些其实看起来不那么“重”的小应用。或者以开发定制化AI模型的方式向第三方收费。
而谷歌、英特尔等巨头企业都在倡导的AI民主化,事实上是将需要大量“AI劳动力”完成的工作装入自动化模型里。向上收回底层技术开发权,向下直接触达细分开发场景。
说白了,小公司、个人创业者、人才稀薄地区想要引入AI,就必须能从成本上越过技术公司,自己玩得起AI.巨头的AI民主,当然是希望消解那些凭借“二手技术”和“雇佣能力”卡位的企业,把他们的份额分给更小的开发者。让开发者仅仅提供创意和运营、市场等能力来激活AI的广泛前景。
所以所谓AI民主,真正消解的是AI当中,非创造性工作制造的准入壁垒。
而在AutoML代表的自动化战略进一步实施后,最可能带来的影响,是AI产业链去中层化。一些看似很大的公司,却做出来很小的价值,仅仅依靠AI技术壁垒来占据市场份额和资本关注,大概是这场“民主运动”中最危险的。
今天的AI,会不会是跑不过马的汽车?
最后,我们可能还要开另一个脑洞:AI民主化虽然听起来很美,但未必全是好消息。
毋庸讳言,AutoML这样的产品在今天带来的AI民主化进度,可以说是肉眼可见的。如果回头看看一两年,很容易就会发现AI的产业链和开发规则已经大变样了。
但这对产业边缘徘徊不前的企业来说一定是好事吗?就像文章开头提到的,AutoML一发布,很多程序员朋友第一反应是调侃自己的AI白学了。但要知道,他们可才学了没有多长时间。那么对于想要进入这个领域的企业来说,类似的恐惧会不会更深?
我们知道,在绝大多数共识里,今天以机器学习为主导的AI复兴,核心区域是由三个因素构成的:算法、算力和数据。
有趣的是,这三个因素在今天都在快速“被民主”。
算法上,AI开发框架开始越来越智能,AutoML这样的产品甚至能自动编程,实现算法工具化和模块化。
算力上,各种新的硬件和处理到来,算力成本近乎每一天都在跌落。
数据上,越来越多的免费数据分享成为常态。并且前沿的AI技术争论中,已经开始质疑大量数据对于深度学习的必须性。
总而言之,差不多每隔一段时间,AI的门槛就会下调一次。但在企业和开发者的角度看,这样的情况就有点苦恼:我们会不会现在部署的AI能力,一个月之后就被淘汰了?
我们知道,汽车最开始是跑不过马车的。虽然最终证明了汽车绝对强过马车,购入汽车是正确的,但大家恐怕都不希望成为那辆超级老爷车的乘客。何况AI这东西连汽车的收藏价值都没有。
就像此时此刻,不知道有没有一位刚刚组建了豪华机器学习专家团队的企业家,突然发现原来自己想做的,随便弄个人操作下谷歌的新软件,再等上一天就搞定了………
也许在今天,正在让企业感受到的,不是AI开发门槛逐步降低带来的愉悦,而是面对AI体系快速迭代产生的恐慌。毕竟我们都不知道,自己今天做的会不会几个月之后就被证明毫无意义。
尤其对于中国企业来说,习惯是赶风口,风来则上风小则退。这么复杂,天天这样那样的AI,谁有心情跟他躲猫猫啊?