当今计算机世界对数据科学的狂热追捧并不是没有缘由的。《哈佛商业评论》将数据科学家列为未来几年最热门的职位上之一,加上诱人的薪水,数据科学家已经成为是许多人梦寐以求的新事业。
与现有专业人员技能要求相比,数据科学家的行业标准似乎高得飘渺。但现有的专业人员的在学习数据科学方面并不是一张白纸,那么应该如何提升自己,晋级到数据科学家呢?这里有十个步骤,是你修炼之路上必不可少的锦囊妙计。
1. 掌握数学、统计和ML的技能
数据科学家要比统计学家擅长软件工程,比任何软件工程师擅长统计数据。在数据和软件上保持平衡,避免任何一方过多或不足。
2. 爱上(大)数据
数据科学家经常要处理大量分离或非分离的数据,往往这些工作不能单纯的靠单一的机器完成。他们大多要使用Hadoop、MapReduce和Spark等大数据软件实现分布式处理。
3. 全面了解数据库
鉴于目前产生数据的速度以秒为单位,大多数行业都在使用诸如MySQL或Cassandra等数据库管理软件来存储和分析数据。因此,对数据库管理系统有良好理解力,也是成为数据科学家的必备条件之一。
4. 学习代码
一个数据科学家在没有学会数据语言之前,不能被称为完整的数据科学家。一组分类良好的数据可能会得出一个清晰的结论,但如果你懂代码,就可以更好的理解数据。一个好的程序员可能不是一个好的数据科学家,而一个优秀的数据科学家肯定是一个好的程序员。
5. 数据清除的管理、可视化和报告
数据清除是将数据的原始形式转换成易于研究、分析和可视化形式的过程。数据可视化同样也是一项非常重要的技能,数据科学家在做数据分析和数据决策是非常依赖于这些技能。
6. 在项目上实践
一旦你成为一名优秀的数据科学家,从理论上讲,所有的一切工作都有关于实践。把时间花在建立自己的强项上,尽可能多的参与项目。
7. 对团队动向有敏锐的洞察力
数据科学家是团队的一个员,当与一群志同道合的人一起工作时,敏锐的观察力总能为团队提供帮助。学会培养发分析数据和做出决策所需要的直觉,密切关注团队其他同事的工作。
8. 沟通技巧
沟通技巧能将数据科学家与优秀数据科学家区分开来。很多时候,你会发现理解力很重要,尤其是当别人向你模糊的解释某些重要的数据分析结果时。在处理不可预见的情况时,你的沟通能力也非常重要。
9. 竞争
Kaggle是一个很好的网站,有很多崭露头角的计算机科学家在网站上寻找队友、或是与其他人切磋技能一争高下。随着行业中此类网站认可的可信度越来越高,这些比赛也正在迅速成为一个向企业展示你的能力的平台。
10. 紧跟数据科学家社区步伐
时刻关注KDNuggets、计算机科学101和DataTau这样的网站,保持与数据科学世界的同步,了解该领域内发生的大事以及目前所提供的职位空缺。
希望上面这十条小建议能帮助你成为优秀的数据科学家。