近日, Vincent Granville在Data Science Central上撰文对2017的数据科学、机器学习和物联网进行了预测。

预测_meitu_1

以下为译文

又到了分享对2017年的预言的时候了,这里抛砖引玉,也希望各位发表自己的观点。

1. 数据科学和机器学习将变得更为主流,特别在以下领域:能源业、金融业(银行、保险)、农业(精耕)、运输业、城市规划、医疗保健(定制治疗),甚至是政府方面。

2. 某些数据科学的门外汉想要创建合法的,有关如何分析数据、算法怎样运转的体系,并打算强制公开算法的秘诀。我相信他们会失败的,奥巴马医改就是一个例子,其中利用的预测算法,忽略了年龄性别来计算溢价,导致了人们需要承担更高的保费。

3. 传感数据崛起。也就是说,物联网将带来数据膨胀,但数据质量、数据相关性及数据安全仍是至关重要的。

4. 随着物联网的崛起,依赖于人工智能、深度学习和自动数据科学的机器或设备间通信的算法 ,更多的过程将实现自动化(如驾驶、医疗诊断和治疗)。我最近也在编写文章来描述机器学习、物联网、人工智能、深度学习和数据科学之间的差异。你可以在DSC进行注册,防止错过该文。

5. 人工智能、物联网、数据科学、机器学习、深度学习和运筹学之间的界限将变得模糊。而统计工程会越来越多地出现在应用程序、机器学习、人工智能和数据科学领域。

6. 许多系统仍然无法正常运转。其解决方法在于人而不是算法。我的文章《为何如此多的机器学习实现都以失败告终》中有提及,一个典型的例子就是“谷歌分析”。谷歌分析不能捕捉到大量明显且又基本的机械交通流,而这种任务对于人来说,根本不需要任何统计和数据科学知识来过滤或拦截。虽然人们发明了基本的方案来解决这些问题,但它却有增无减。虚假评论、新闻,推特上未检测出的仇恨言论,谷歌搜索上未检测到的剽窃行为,都属于同一类别。最终,它为新玩家留下了可以进入和构建实际工作系统的空间。

7. 对公共数据和公共新闻的依赖将会面临更仔细的审查。有人说预测选举的失败是数据科学的失败。但在我看来这是一种不同类型的失败,它未能意识到媒体的偏见(他们发布的都符合他们自身议程预测),甚至那些做调查的都是有偏差的(充满谎言)。同时它也没有意识到选举中的高波动性以及日常的巨大变化。任何能够计算出包含历史数据的良好的置信区间的人,都认为这是不可靠的预测结果。最后,我一直都认为获胜者最擅长玩把戏,包括操纵黑客与贿赂媒体。

8. 越来越多的数据清理、预处理和探索性数据分析将变得自动化,我们也将面对更多的非结构化数据,当然,也会用一些方法来使它们变得结构化。多个算法和模型逐渐混合在一起,来提供效果好的模式识别和预测系统,以提高精度。

9. 在领先的从业者带领的大学课程的引导下,数据科学教育将不断发展,通过数据科学营找工作的人会更少。许多这种类型的训练营不会培训你成为数据科学家,而是让你变成一个只知晓经典的、基本的、甚至过时且危险的统计知识的Python/R/SQL码农。因此,数据营不得不改善,否则将冒成为另一种凤凰城大学的风险。

10. 对有关数据的基础建设的攻击将会从窃取或清除转变为修改数据。如果安全漏洞没有被修缮,某些攻击将从物联网设备开始。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-31 09:28:00
大数据资讯 2023数据科学峰会 百分点科技正式发布数据科学基础平台
3月30日,由百分点科技主办的“2023数据科学峰会”在北京金隅智造工场·科技秀场成功召开。 <详情>
2020-09-23 09:21:00
互联网 迎接数据科学ML+和DL+时代的来临
“Gartner提出,到2024年底,75%的企业机构将从人工智能试点转为AI运营,基于流数据的分析基础架构的数量将因此增加5倍。 <详情>
2020-02-21 13:22:00
大数据资讯 意料之外 情理之中:解读Gartner 2020年数据科学和机器学习平台魔力象限
最近Gartner发布了数据科学和机器学习(DSML)平台魔力象限报告。数据科学、机器学习和人工智能的市场格局极为分散,竞争激烈且难以理解。Gartner尝试根据明确定义的标准对 <详情>
2020-01-13 17:45:00
大数据技术 数据科学初学者面临的5个常见误区
数据如今已经体现出巨大的价值——企业通过数据分析来为包括市场支出、员工决策到产品开发等所有事情提供参考性建议,而这也意味着,数据科学家在工作中的价值正变得越来越 <详情>
2019-12-30 17:50:00
大数据资讯 2020 年数据科学就业市场必备的五项技能
为了保持竞争力,一定要为新工具带来的新工作方式做好准备!以下就是2020 年数据科学就业市场必备的五项技能。 <详情>
上海市对2019年以来新建数据中心项目后评估 包括关键指标、功能定位等
2024-12-11 15:07:20
阿里云回应数据中心失火:切割施工产生高温铁渣导致,未造成人员伤亡和财产损失
2024-12-11 15:02:17
从全球布局到持续创新 Akamai如何获得中企出海的青睐
2024-12-11 15:00:57
12月19-20日,8000+算力产业代表齐聚北京,第十九届中国IDC产业年度大典即将正式启幕!
2024-12-11 11:57:02
议程揭晓丨12月20日算力技术创新与应用系列论坛
2024-12-09 15:47:29
采访普洛斯数据中心郭仁声:智算时代 我们需要怎样的算力与数据中心
2024-12-09 11:44:05
5040机架 内蒙古云著智算产业园项目一期封顶
2024-12-06 14:24:19
马斯克超级计算集群再升级:xAI扩大GPU规模至百万
2024-12-06 14:21:34
未来10年的智算中心应该怎么建?|12月20日北京,AI算力建设系列论坛将启
2024-12-06 11:44:36
亚马逊发布超级计算机集群和新型AI芯片服务器
2024-12-05 14:54:16
12月20日北京,聚焦区域算力生态|2024算力产业生态高质量发展大会
2024-12-05 11:27:14
以用户需求为核心,科华数据领航高端定制数据中心新赛道
2024-12-04 15:52:50
英特尔CEO突然宣布退休 数据中心芯片竞争力不足或是主因
2024-12-04 10:12:00
莲花控股终止与新华三6.93亿订单:已自持700台算力服务器
2024-12-04 10:06:00
头部算力企业将悉数亮相、大咖云集,完整议程重磅公布|12月19-20日,北京,第十九届中国IDC产业年度大典重磅启幕
2024-12-04 09:54:00