数据分析是什么?
很多人都没有搞懂数据分析是什么,包括一些公司和企业也没搞清楚数据分析的定义。经常听到有人说投了数据分析的岗位,结果入职之后每天干的活就是取数给业务用,感觉自己就像个取数机。这样的工作根本不能叫做数据分析。什么是数据分析,用我自己的话来说就是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。这一句话也基本涵盖了数据分析的流程:目标确定——数据获取、清洗、整理——数据分析——结果呈现
如何成为一个数据分析师
一般,数据分析师分为两类。之一类是编程类;第二类是非编程类。无论哪一类,都需要先入门数据分析。小编为大家推荐三本入门必看书籍:《深入浅出数据分析》可快速了解自己是否适合数据分析职位;《谁说菜鸟不会数据分析》了解数据分析流程和 ;《数据化管理》帮助了解数据在市场、营销等方面的应用。之一类编程类需要的技术有Excel、PPT、以及SQL等;第二类非编程类需要的技术有Python、R编程。
基本技能
就数据分析学习而言,需要的技能模块有统计基础+数据库知识+编程能力。
1.统计基础
理工科的学生在本科阶段学习过概率论与数理统计,单从做数据分析的角度已经够用。其他方面,可以根据需要查看相关书籍,随时进行查漏补缺即可。个人推荐《深入浅出统计学》,可以让统计理论的学习有趣又自然。
2.数据库知识
关系型数据库很重要。在学习数据分析的初期甚至很长一段时间,你接触到的数据都存储在关系型数据库中,需要学习SQL语言进行数据查询。关于SQL语言,强力推荐《SQL必知必会》,整本书通俗易懂,是学习SQL语言的不二之选。
学习数据库的本质就是在学习一种与数据打交道的逻辑思维与能力。编程中的很多思想都和关系型数据库、SQL相通,比如:SQL中对data进行group by的操作,这个在Excel里类似于透视表,在Python/R中也有相应的group function去处理数据。甚至在以后的进阶过程,你会接触到分布式数据库和所对应的no-SQL语句。
3.编程能力
Excel。 透视表(Pivot Table)是做数据分析的必备技能。透视表可以帮你迅速汇总数据,看到各类型数据的直观特征就像是让你站在更高的视角看待数据。作为进阶,Excel自带的函数、各种插件,以及VBA也是很好的工具。
Python。当数据量大到用Excel打开都要很久或者我们想进步提升能力时,需要学些***技能,即用编程语言做数据分析。这里主要有R和Python两大流派。个人推荐Python,一是代码简单易懂,容易上手;二是学习资料多,降低学习成本。推荐《利用Python进行数据分析》,涵盖了利用Python做数据清洗,数据可视化及分析的技能点,可以作为一本工具书随时查阅。
适合对数据分析的入门者,对数据分析没有整体概念的人,常见于应届毕业生,经验尚浅的转行者。
HeadFirst类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。——Simon
《深入浅出数据分析》:把这本书放在之一顺序,是因为它真的很简单,但是能够让你对数据分析的一些基本概念有大致的了解。即便是你毫无数据分析经验,一两天也足够读完整本书了。这本书的实操性并不强,所以也不建议你去跟着实践,了解作者传达出来的数据分析基本思想和原则就OK了,这对你建立宏观的视野,和接下来的学习很有帮助。
统计学概念在数据分析中的作用:比如方差、标准差、相关系数、均方根误差等; 集中数据分析的基本 :假设检验、回归分析、误差分析等; 统计图形分析:散点图、直方图等来探索数据中隐藏的规律; 数据库以及数据整理。
这本书很让你掌握数据分析技术,过一遍即可。
《谁说菜鸟不会数据分析》:不仅讲解了一些常见的分析技巧,并附带excel的一些知识及数据分析再公司中所处的位置,对职场了解亦有一定帮助。
具有一定的行业针对性,要求具备一定的分析常识,适合网站分析师,商业分析师以及数据产品经理。
《深入浅出统计学》: HeadFirst类书籍,可以帮助你快速了解统计方面的知识。
更高阶的数据相对来说专业性较强了,如涉及到企业内部数据治理,数据结合的业务分析,数据可视化等。当然,还有数据挖掘算法之类的更深入的东西,这块没有研究就不瞎推荐了
《精益数据分析》:此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。
数据分析好帮手-亿信ABI
想要做好数据分析好的工具能让你事半功倍,最后推荐一款好用的数据分析工具——亿信ABI,从数据源接入,到数据采集、数据处理,再到数据分析和挖掘,打通数据生命周期的各个环节,实现数据填报、处理、分析一体化,可为用户提供一站式数据服务。既能支持对分析表进行数据回填设置,又能完成数据融合,提升数据质量。
最最关键的是,不论是导入数据、构建数据仓库,还是 各类分析展现、数据挖掘等,设计过程完全可视化。过程中,所有操作无需定义复杂公式,仅需拖拉拽即可快速完成设计,零门槛、上手快,就算是技术小白也能快速上手,感兴趣的小伙伴们可以试试。