您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

三要三不要:成功数据科学家都知道的黄金法则

发表于:2020-12-07 作者:读芯术 来源:读芯术

本文转载自公众号“读芯术”(ID:AI_Discovery)。

数据科学和人工智能可谓当下最为热门的领域,也是人们最常提及的实体类数据管理。数据科学与人工智能持续发展成果不断,给人们提供了各种机会。但在成为优秀的数据科学家或机器学习操作者之前,你必须遵循几条黄金法则来提高生产力。 笔者学习机器学习和深度学习模型有一阵子了,也一直在做各种项目。根据笔者的经验,“三要三不要”法则你最好能从一开始就了解。话不多说,来看看关乎你数据前途的要点。

一要:广泛搜查,持续学习

这些领域每天都在进步。技术发展迅猛,所以紧跟发展、了解数据科学中的最新成果显得越发重要。查找项目、任务甚至是一个简单的数据科学术语,都必不可少。向他人学习,特别是一些专家的观点,这些人都有着自己的见解,你可以学习运用。 查找和批判性思考就是提升水平的一种途径。极力推荐大家到Youtube上看一些高质量的视频,比如数据科学、人工智能、数学或编程频道。多读书,论文更重要,后者是获取正确知识的关键,对你理解数据科学的某个话题也有帮助。

一不要:放弃!

数据科学有时会很棘手,初学者刚上手会很难。不少人看一眼这个领域里的话题都害怕。其实,它同编程一样,出现错误意味着你会学到新的东西。不论到网上寻求解决方案,亦或自己攻克,从中你都会获得满足感。 初出茅庐不会解决问题也不要紧,只要持之以恒寻找出路加深理解,你就会进步。哪怕是专家也会犯错然后找资料解决特定问题。这大概是唯一一个不用恶补知识的领域了,忘记的知识谷歌上都可以查。 笔者鼓励大家转变对挑战性任务的看法,多几分享受。失败乃成功的奠基石,在数据科学中,犯错越多学的就越多。振作起来学习吧!

二要:实践操作

想要欣赏数据科学的“真善美”,最好要有很多项目的实践经历。可操作性高的任务和能力范围内的难题绝对给你很妙的体验。从理论的角度了解数据科学背后的机器学习、数学概念很关键。当然也要知道如何实操,不要怕麻烦,你要独立完成这些。 设想一个多层次感知器或神经网络的反向传播,你可能知道这些概念在数学和理论方面意味着什么。但实际操作和摸索方案也同等重要,后者对于提升和面试大有益处。 哪怕是一个简单的机器学习算法,都建议不要用算法库或类似的辅助工具。试着发现最好的办法,上手操作。如此可以提升技巧,对概念有更全面的理解。

二不要:犹豫不决,我要不要寻求帮助

过程中碰壁再正常不过,而数据科学的迷人之处就在于背后有非常优秀的群体,里面有很多人才和资源可以帮到你。Stack Overflow、discord channels、YouTube、免费的在线编码训练营、GitHub等有关数据科学的平台。 跟他人或者专家沟通交流也是明智之举。有效的沟通可以纠正你对某个话题的误解。同样,沟通能让他人听到你的观点,自己也能学到点。交流得越多,观点越完善,最大的作用是自己的社交能力会有所提升,这也是团队工作需要的。 过去笔者对于寻求帮助犹豫不决,认为凭自己解决所有问题才是正确的。但有时候也许是理解错或者有瑕疵,自己试过仍不行,就可以去问朋友或专家,请他们帮你!

三要:保持探索,建立新项目,积极实践!

人工智能与数据科学浩瀚无边,有很多东西等着我们去探索。置身于庞大的领域中,实践对于更新自己的能力和实操技巧愈发重要。发展从未停止,其中各个方面也包含很多知识,所以请坚持编码和实操! 积极参加网络上的竞赛。Kaggle就挺不错,上面会举办一些高权威的数据科学比赛。别怕成绩不好,只要学到东西就好。还有很多网站可以提升编码技能或参加比赛,比如HackerRank。加入群体后你可以向更多爱好者取经。 可操作的项目和想法数不胜数。选一个就可以着手开始了。不断学习的最佳办法就是多做!找更多的项目,更新技能!

图源:unsplash

三不要:问题解决后不要停止对更好方案的追求

恭喜各位完成了项目!但是还有更多等待你去挖掘。这个领域的魅力之处在于它提供了多样的选择。你所建的每一个模型和项目都有很大的提升空间。考虑别的可能性、其他方法和提升是好习惯,你会得到更好的结果。 最初,笔者每完成一个项目都会非常激动,着急做下一个任务。这没毛病,但往往你的项目是可以进一步提升的。在进行下一项之前,列出项目中可以完善的几个方面。

总而言之,不断学习、不断实践、不怕失败、完善技能,这些就是你通向数据科学大师的不二法门。