4008-953622
数据分析
超级菜鸟如何入门数据分析?(建议收藏)
发布时间:2020-02-03    信息来源:未知    浏览次数:

  经常看到很多朋友会问,入行数据分析之前我要不要学个java,学个Tableau,然后在学个Python会比较容易。好像是说,数据分析一定需要Python才能做,分析变成了为某种编程语言、某种可视化工具服务。

  其实这样误区的是很不对的,按这种方式学习下去,即使最后Python学的很好,也挺难找到一份数据分析的工作。

  所以在讨论这个话题之前,第一个问题可能要思考的是什么是数据分析。为了简便,第一部分先用之前整理的几张图回答:

  第二部分谈的是关于数据分析这个岗位不同阶段所需要业务能力和技能需求(这一部分来源参考了各种大佬的解答)。

  这是个使命必达的阶段,你核心要做的是快速学习,执行配合,业务能力上你需要做到几点:

  这是个无懈可击的阶段,你核心要做的是独立执行,小有成就,业务能力上你需要做到几点:

  这是个无中生有的阶段,你核心要做的是发掘项目,主动执行,业务能力上你需要做到几点:

  这是个独当一面的阶段,你核心要做的是推动业务,辅导团队,业务能力上你需要做到几点:

  这是个红杏出墙的阶段,你核心要做的是统筹规划,名声在外,业务能力上你需要做到几点:

  这是个诸葛连弩的阶段,你核心要做的是参与决策、指挥有度,业务能力上你需要做到几点:

  这一部分谈的数据从业者需要学习的一些技能,下图后面有拆解版(图打开看更清晰)。

  SQL一定要写的非常熟练,最好是熟悉Hive-sql,可参见以下文章:3道TMD热门数据分析面试题,我们帮你解了

  第二部分是推断性统计,你最少要知道中心极限定理、大数定律、置信区间、假设检验、t检验、f检验、卡方检验、ABtest等等。(面试考这一部分较多)可参考这篇文章:什么是A/B test?有哪些流程?有什么用?终于有人讲明白了

  这部分你需要从几点准备,第一要理解每个算法的应用背景,优缺点(最重要的)。第二,熟悉常见的公式推倒(不需要每个都会)。大致要掌握的是逻辑回归、SVM、决策树、随机森林、Adboost、XGboost等集成学习、神经网络。

  (DNN、CNN、inception、ResNet、RNN、LSTM等深度学习算法在数据分析面试中很少问,不需要准备那么多。)

  这部分可以从“人人都是产品经理”社区、增长黑客等内容学习,你最少要知道Pv、Uv、DAU等各种指标,如何进行指标拆解、如何进行流量分析、留存分析、用户行为分析,啥是海盗模型,RFM模型、某个指标下降/上升如何分析等等。笔者之前做流量分析的时候会做一个这样框架图:

  语言:非大数据类R、Python最多(比较geek的也有用julia的,不差钱和某些公司要求的用SAS、Matlab)。

  数据分析的小方向比较多,分类方法也不尽相同。在这里根据技术要求的侧重点不同,简单的划分为三个方向(这部分回答乘次不齐,有的是直接简单的分技术类和业务类,这里参考广大网友作答):

  重点在于如何设计高效的数据模型,以及如何通过BI工具从多个角度观察数据,了解数据内部的规律。

  传统的BI工具可以满足大部分传统企业的数据分析场景。近些年随着分析工具功能日趋强大,大数据领域的BI平台也有了长足的发展。所以BI仍然具有强大的生命力。

  机器学习与BI的区别在于,更多的依赖机器模拟人类学习的过程去发现数据内在的规律,构建一个数据模型,通过某些算法来预测未来的可能性。

  机器学习和深度学习概念非常火热,但相对入门门槛也较高,因为想真正理解那些算法的原理需要高等数学的基础。

  还有一些数据分析师,仅仅通过一些公开的市场宏观数据,通过经济学和统计学分析方法,观察经济的运行状况,从而发现行业的经济发展规律,进一步预测未来行业发展的趋势。这个方向也很不错的,但是需要对统计和经济学有一定基础。

  首先要认准自身的优势,参考上面列出的几个发展方向,选择其一进行深入的学习和实践。

  做适合的和喜欢的最重要。不论哪个方向,都是要先掌握工具使用,了解你要分析的业务流程,培养独到的分析思维模式,锻炼自己的表达。

  Sql类我只看了三本书(我不会推荐sql必知必会系列,对比看,你会发现这里SQL基础和进阶书写的非常好,至少是很适合分析师看的数据库书):

  一些大佬,排名不分先后,履历真的厉害,有行业领军人物,有年轻的数据总监,有几十万粉的博主。就不一一介绍了,因为我也是网上看到这些大佬的相关问答,各位有兴趣可自己看:

  当然还有很多优秀的书籍和作者,这里不在一一列举了,希望以上回答对想入手数据分析的朋友有些帮助。

  机器学习入门必读:6种简单实用算法及学习曲线大风口!什么是图神经网络?有什么用?终于有人讲明白了

  大家好,我是宝器!今天这篇文章是宝器在知乎上的一个问答,超级菜鸟如何入门数据分析?我的回答全文大致如下(全文很长,建议收藏阅读):经常看到很多朋友会问,入行数据分析之前我要不要学个jav......

  读了《谁说菜鸟不会数据分析——入门篇》,做了一些总结如下:一、数据分析那些事儿1、什么是数据分析数据分析指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数...

  感谢关注天善智能,走好数据之路↑↑↑欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!对商业智能BI、大数据...

  这段时间在学习Excel和Python相关内容,Excel数据分析入门有一本《谁说菜鸟不会分析(入门篇)》,内容细致,简洁易懂,注重培养分析的思维而不仅仅是告知方法。在学习Python过程中萌发了通过...

  温馨提示:请先喝一杯水,因为内容太干;1,数据分析的重要性当你选择要学数据分析的时候,你一定知道数据分析的重要性赋予自己一技之长,安生立命,养家糊口创造价值,实现自我价值大势所趋,顺势而为,大放异彩从...

  PPT查看1PPT查看2 思维导图下载 ppt下载什么是数据分析?怎么样才是数据分析的思维?数据分析的流程有哪些?常用的数据方法又有哪些?工具呢?可以学习的网站有哪些?我觉得《谁说菜鸟不会数据分析(入...

  1、数据分析方法数据分析作用与对应的分析方法 数据分析作用 基本方法 数据分析方法 现状分析 对比 对比分析、平均分析、总和评价分析 原因分析 细分 分组...

  前几天部门主管推荐下买了本《谁说菜鸟不会数据分析》,这本书在数据分析领域还是挺有名气的。以前大数据这个词应该仅限专业领域被引用,记得以前接触过气象数据,有些气象数据是自上世纪90年代开始...

  一、常用指标、术语 1、平均数 2、绝对数与相对数 3、百分百、百分点 4、频数、频率 5、比例、比率 6、倍数、番数 7、同比、环比二、分析思...

  1、何谓数据分析数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细...

  什么是数据分析?顾名思义,数据分析就是对数据进行分析。 可是,数据分析的真正定义是什么呢? 数据分析是指利用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总消化并理解,以最大化地开发数据功...

  1、数据分析报告:三大作用四项基本原则定义 是根据数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。 这...

  1、数据分析方法论确定分析思路需要以营销、管理等理论为指导,把这些跟数据分析相关的营销、管理等理论统称为数据分析方法论。 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,更多的是指数据分析...

  目录描述第1章 数据分析那些事儿第2章 确定分析思路第3章 数据准备第4章 数据处理第5章 数据分析第6章 数据展现第7章 图表可以更美的第8章 专业的报告第1章 数据分析那些事儿第2章 确定分析思路...

  三四月份投了字节跳动的实习(图形图像岗位),然后hr打电话过来问了一下会不会opengl,c++,shador,当时只会一点c++,其他两个都不会,也就直接被拒了。七月初内推了字节跳动的提前批,因为内...

  在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次...

  由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,...

  大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频...

  将代码部署服务器,每日早上定时获取到天气数据,并发送到邮箱。也可以说是一个小人工智障。思路可以运用在不同地方,主要介绍的是思路。...

  杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。...

  博客说明:这是自己写的有关python语言的一篇综合博客。只作为知识广度和编程技巧学习,不过于追究学习深度,点到即止、会用即可。主要是基础语句,如三大控制语句(顺序、分支、循环),随机数的生成,数据类...

  从 PC 时代至今,众人只知在 CPU、GPU、XPU、制程、工艺等战场中,英特尔在与同行硬件芯片制造商们的竞争中杀出重围,且在不断的成长进化中,成为全球知名的半导体公司。殊不知,在「刚硬」的背后,英...

  昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔...

  机械转行java自学经历,零基础学java,血泪总结的干货据说,再恩爱的夫妻,一生中都有100次想离婚的念头和50次想掐死对方的冲动。求职路上亦是如此,打开这篇文章,相信你也有转行的想法。和身边的朋友...

  遥想当年,机缘巧合入了 ACM 的坑,周边巨擘林立,从此过上了天天被虐似死狗的生活…然而我是谁,我可是死狗中的战斗鸡,智力不够那刷题来凑,开始了夜以继日哼哧哼哧刷题的日子,从此读题与提交齐飞, ...

  欢迎来到“Python进阶”专栏!来到这里的每一位同学,应该大致上学习了很多 Python 的基础知识,正在努力成长的过程中。在此期间,一定遇到了很多的困惑,对未来的学习方向感到迷茫。我非常理解你们所...

  专栏C++学习笔记《C++ Primer》学习笔记/习题答案 总目录———————...

  最近打开电脑,系统总是自动弹出Windows许可证即将过期的弹窗,现在总结方法如下。命令都是在运行窗口输入的打开方式:win+R组合键或者右键点击win10开始菜单,点击“运行”查看系统版本:winv...

  一、垃圾文字生成器介绍最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator根据作者的介绍,他...

  是一个老生常谈的话题,然而随着不断的学习,对于以前的认识有很多误区,所以还是需要不断地总结的,学而时习之,不亦说乎...

  你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源,有一线大厂面试点脑图,欢迎Star和完善前言这一期不算《吊打面试官》...

  11月8日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会、可信区块链推进计划联合主办,科技行者协办的2019可信区块链峰会将在北京悠唐皇冠假日酒店开幕。区块链技术被认为是继蒸汽机、电力...

  引子Hacker(黑客),往往被人们理解为只会用非法手段来破坏网络安全的计算机高手。但是,黑客其实不是这样的,真正的“网络破坏者”是和黑客名称和读音相似的骇客。骇客,是用黑客手段进行非法操作并为己取得...

  网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法落地...

  位算法的效率有多快我就不说,不信你可以去用 10 亿个数据模拟一下,今天给大家讲一讲位运算的一些经典例子。不过,最重要的不是看懂了这些例子就好,而是要在以后多去运用位运算这些技巧,当然,采用位运算,也...

  不知觉已中码龄已突破五年,一路走来从起初铁憨憨到现在的十九线程序员,一路成长,虽然不能成为高工,但是也能挡下一面,从15年很火的android开始入坑,走过java、QT,目前仍处于andr...

  一、前言 在可视化化程序设计的今天,借助于集成开发环境可以很快地生成程序,程序设计不再是计算机专业人员的专利。很多人认为,只要掌握几种开发工具就可以成为编程高手,其实,这是一种误解。要想成为一个专业的...

  作者 胡书敏 责编 刘静 出品 CSDN(ID:CSDNnews) 本人目前在一家知名外企担任架构师,而且最近八年来,在多家外企和互联网公司担任Java技术面试官,前后累计面试了有两三...

  作者 马超 责编 胡巍巍 出品 CSDN(ID:CSDNnews) 近日,腾讯自研的万亿级分布式消息中间件TubeMQ正式开源,并捐赠给Apache基金会,成为基金会官方认可的Inc...

  知乎高赞:中国有什么拿得出手的开源软件产品? 在知乎上,有个问题问“中国有什么拿得出手的开源软件产品(在 GitHub 等社区受欢迎度较好的)?” 事实上,还不少呢~ 本人于2019.7.6进行...

  一、数据库简介 数据库(Database,DB)是按照数据结构来组织,存储和管理数据的仓库。 典型特征:数据的结构化、数据间的共享、减少数据的冗余度,数据的独立性。 关系型数据库:使用关系模型把数据...

  引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成。 准备工...

  作者 许向武 责编 屠敏 出品 CSDN 博客 前言 在 Python 进阶的过程中,相信很多同学应该大致上学习了很多 Python 的基础知识,也正在努力成长。在此期间,一定遇...

  今天咱们第一课,来讲讲大家一直很关注的数据中台。其实,数据中台也是企业数据管理的一部分,甚至可以说是很重要的一部分。 一、什么是中台? 这其实是一个老生常谈的概念了,中台,顾名思义,就是在起中间作...

  张小龙生于湖南邵东魏家桥镇, 家庭主要特点:穷。 不仅自己穷,亲戚也都很穷,可以说穷以类聚。爷爷做过铜匠,总的来说,标准的劳动阶级出身。 家有兄弟两人, 一个小龙,一个小虎。 小虎好动,与邻...

  2019年互联网寒冬,大批企业开始裁员,下图是网上流传的一张截图: 裁员不可避免,那如何才能做到不管大环境如何变化,自身不受影响呢? 我们先来看一个有意思的故事,如果西游记取经团队需要裁员一名,会裁...

  坐着绿皮车上海到杭州,24块钱,很宽敞,在火车上非正式地聊几句。 很多编程语言都以 “没有指针” 作为自己的优势来宣传,然而,对于C语言,指针却是与生俱来的。 那么,什么是指针,为什么大家都想避开指...

  我清晰的记得,刚买的macbook pro回到家,开机后第一件事情,就是上了淘宝网,花了500元钱,找了一个上门维修电脑的师傅,上门给我装了一个windows系统。。。。。。 表砍我。。。 当时买ma...

  二哥,你好,我想知道一般程序猿都如何接私活,我也想接,能告诉我一些方法吗? 上面是一个读者“烦不烦”问我的一个问题。其实不止是“烦不烦”,还有很多读者问过我类似这样的问题。 我接的私活不算多,挣到的...

  今年正式步入了大四,离毕业也只剩半年多的时间,回想一下大学四年,感觉自己走了不少弯路,今天就来分享一下自己大学的学习经历,也希望其他人能不要走我走错的路。 (一)初进校园 刚进入大学的时候自己完全...

  在阿里,40岁的奋斗姿势 在阿里,什么样的年纪可以称为老呢?35岁? 在云网络,有这样一群人,他们的平均年龄接近40,却刚刚开辟职业生涯的第二战场。 他们的奋斗姿势是什么样的呢? 洛神赋 “翩若...

  大家好,我是 Rocky0429,一个最近老在 GitHub 上闲逛的蒟蒻… 特别惭愧的是,虽然我很早就知道 GitHub,但是学会逛 GitHub 的时间特别晚。当时一方面是因为菜,看着这种全是英...

  要说微信最让人恶心的发明,消息撤回绝对能上榜。 比如你现在正和女朋友用微信聊着天,或者跟自己喜欢的女孩子聊着天,一个不留神,你没注意到对方发的消息就被她及时撤回了,这时你很好奇,好奇她到底发了什么?于...

  每天都会收到很多读者的私信,问我:“二哥,有什么推荐的学习网站吗?最近很浮躁,手头的一些网站都看烦了,想看看二哥这里有什么新鲜货。” 今天一早做了个恶梦,梦到被老板辞退了。虽然说在我们公司,只有我辞退...

  依稀记得,毕业那天,我们导员发给我毕业证的时候对我说“你可是咱们系的风云人物啊”,哎呀,别提当时多开心啦????,嗯,我们导员是所有导员中最帅的一个,真的???? 不过,导员说的是实话,很多人都叫我大...

  这是作者的网络安全自学教程系列,主要是关于安全工具和实践操作的在线笔记,特分享出来与博友们学习,希望您们喜欢,一起进步。前文分享了中间人攻击或ARP欺骗攻击,从ARP原理到局域网配置进行描述。这篇文章...

  CPU对每个程序员来说,是个既熟悉又陌生的东西? 如果你只知道CPU是中央处理器的话,那可能对你并没有什么用,那么作为程序员的我们,必须要搞懂的就是CPU这家伙是如何运行的,尤其要搞懂它里面的寄存器是...

  Python标识符 所谓的标识符就是对变量、常量、函数、类等对象起的名字。 首先必须说明的是,Python语言在任何场景都严格区分大小写!也就是说A和a代表的意义完 全不同。 命名规范 1)标识符对大...

  很遗憾,这个春节注定是刻骨铭心的,新型冠状病毒让每个人的神经都是紧绷的。那些处在武汉的白衣天使们,尤其值得我们的尊敬。而我们这些窝在家里的程序员,能不外出就不外出,就是对社会做出的最大的贡献。 有些...

  今天,群里白垩老师问如何用python画武汉肺炎疫情地图。白垩老师是研究海洋生态与地球生物的学者,国家重点实验室成员,于不惑之年学习python,实为我等学习楷模。先前我并没有关注武汉肺炎的具体数据,...

  此次冠状病毒来势汹汹,如何通过数学模型预测肺炎的传播呢?有两个大的方向: 利用历史数据对未来的感染人数做预测:这是一个较为简单的预测模型,可以有以下几种思路:1. 利用历史数据进行拟合,得到拟合曲线...

  python是当下很热门的语言,我在入门python时花的时间特别长,一方面是自学,另一方面是这个东西对新人很不友好。因此,我写下这篇文章,希望能对想从零开始学python的同学有一些帮助。 首先给大...

  地图绘制 数据源 腾讯疫情实时追踪 网站结构比较简单,可以直接获取json格式的数据 抓取每个城市的当前感染数据 导入相关模块 import time import json import re...

  第零关 进入传送门开始第0关(游戏链接) 请点击链接进入第1关: 连接在左边→ ←连接在右边 看不到啊。。。。(只能看到一堆大佬做完的留名,也能看到菜鸡的我,在后面~~) 直接fn+f12吧 <...

  NO.1 有20瓶药丸,其中19瓶装有1克/粒的药丸,余下一瓶装有1.1克/粒的药丸。给你一台称重精准的天平,怎么找出比较重的那瓶药丸?天平只能用一次。 解法 有时候,严格的限制条件有可能反倒是解题...

  过完春节后,今天才开始进入学习状态。我对2020年充满希望,也希望在新的一年里的我能够更进一步。 2019年十月份开始,正式进入了TGB这个令人值得探索的神奇领域。从小到大一直感觉自己的名字能被老师记...

  最近看到别人搭建了自己的实时聊天室便产生了兴趣,于是乎自己也着手搭建了一个。在socket这里我选用了socket.io这个模块,在网上看了很多的博客不过还是一头雾水,于是上了socket.io的官网...

分享到:
您使用的浏览器版本过低,不仅存在较多的安全漏洞,也无法完美支持最新的web技术和标准,请更新高版本浏览器!!