数据分析师速成的必备资源

随着Python越来越火,微信/知乎/微博等社交平台充斥着各种0元58天成为数据分析师的课程,也有很多人报了名,但不知道有多少人坚持到第58天,又有多少人真正用了起来.

诚然,如果坚持了58天,哪怕心里并没有任何感觉,也至少是一个好的开端,为了能够带领众多小白(包括自己)能够更方便地做自己的数据分析,把数据分析相关的资源罗列,方便学习和使用.

数据分析师速成的资源中,Python当然是最基础的一部分,需要课程进行系统学习,而之后的数据\分析方法\第三方库则相对零碎,随时使用google搜索即可,下面针对每个方便进行说明:

1. 课程

由于网上如今的课程甚至已经侵占了社交App,可想而知得到免费的课程几乎没有难度,虽然免费的可能绝大多数都是入门系列,但也足够入门了,毕竟Python本身算是一门很容易入门的语言,并且对于绝大多数人来说都有价值,比如聚类\回归\画图\P图\语言理解\词云\出国(网络)等等,可以说无所不包,只要能够找到对应的包(Package).

对于自主能力较差的同学,建议使用爱慕课学习.爱慕课将知识拆成”百度知道”的结果一样零碎,每次学习的时间很短,但一定要记笔记;对于自主能力比较强的同学,推荐廖雪峰的课程,讲解的很到位,需要较强的动手能力和资料查阅能力.

微信朋友圈的那种58天成为数据分析师的课程就不推荐了,还得加群接收广告.

2. 数据

数据分析师没有数据,就像无米之炊.数据分析是基于数据的目的,想要通过数据来体现什么东西,就用什么分析方法(对应的第三方库)通过Python实现,得到我们想要的结果.

此处分享一个非常实用的数据平台,拥有庞大的数据库,包括股票,基金,期货,宏观经济,行业经济,新闻数据等,目前免费提供,更重要的是数据可以通过Python直接调用,这给我们学习分析方法提供方便.

这个平台的数据使用很方便,只需要注册一个账号之后,获取一个免费的数据token即可使用,能够获取各类经济数据进行分析.

操作方法

3.分析方法

该部分与Python没有关系,关键在于分析方法的选取.正如我们想知道哪辆车跑得快就需要用速度=路程/时间这样的公式来计算,最终通过比较速度的大小来得出哪辆车的速度更快,数据的分析方法也是一样的道理,只不过分析方法有差异而已.

通常,对于绝大多数人来说基本不会用到很复杂的分析方法,工作中接触到的数据主要使用excel搞定,用到的方法主要是:

  • 基本统计(求和,求平均值)
  • 对比分析(趋势,同比,环比)
  • 结构分析(分类汇总,占比分析)
  • 预测分析(聚类,回归)
  • 其它分析(跨表查询,财务类分析,决策分析)

其它的更复杂的分析不需要深究,用的时候再学习不迟,况且如今有很多大神,以”第三方库”的形式将复杂的分析方法封装了起来,我等小白只需要拿起黑箱使用即可,例如有名的tensorflow(基于深度神经网络),numpy(矩阵计算),scikit-learn(很多好用的分析方法)等等.

所以,这一部分最重要的一点是理解分析方法的功能和用途,弄懂每种方法实现的目的即可,具体的实现由第三方库解决.

4.第三方库

Python最强大的地方就在库,库的共享极大促进了科技的进步.要知道Python的每一个库都是为了实现某个功能而封装起来的,下面两个链接足够你惊叹好一会了.

你能想出来的功能,总有能找到的库.这句话毫不夸张,但是我们主要的目的是数据分析,下面分享一个数据分析方面的库,这里边库不多,但使用频率非常高:

数据分析库-代码速查表

最后,向大神致敬!我等小白继续埋头学习吧

ddzzhen

3 Responses

发表评论