4008-953622
数据分析
数据分析必备思维之:逻辑思维
发布时间:2019-12-17    信息来源:未知    浏览次数:

  本文来说一下数据分析必备的第二种思维——逻辑推理思维。逻辑推理一般有演绎法、归纳法、类比法,文章简单介绍一下数据分析工作中比较常用的演绎法和归纳法。

  本文来说一下数据分析必备的第二种思维——逻辑推理思维。逻辑推理一般有演绎法、归纳法、类比法,文章简单介绍一下数据分析工作中比较常用的演绎法和归纳法。

  我翻阅了一些数据分析师的招聘要求,几乎所有的招聘要求中,都会有这么一条,叫做“逻辑思维能力强”。但是又很少有人能说清楚到底什么叫做“逻辑思维能力强”。

  中国的教育在逻辑这一块上是非常欠缺的,即使是很多接受过高等教育的人,思路依然是非常没有条理的。日常工作中的数据分析,运用最多的逻辑方法就是逻辑推理,从一堆数据中推理出和业务有关的信息。

  逻辑推理一般有演绎法、归纳法、类比法,我简单介绍一下数据分析工作中比较常用的演绎法和归纳法。

  首先要明确,数据分析最终产出的最小单位应该不是一个数据,而是数据背后的信息。换句话说,数据分析的产出需要一个论述。

  “黑名单用户占比0.5%,影响比较小。”这才是一个完整的数据产出。其中包括论据“用户占比”,也包括论点“影响比较小”。

  演绎法,常见的类型有三段论、假言推理、选言推理等。本文主要介绍一下最常见的三段论。

  有关三段论最常见的案例是“苏格拉底三段论”,几乎所有讲逻辑思维的书里都会提到这个案例。

  苏格拉底三段论中,一般的情况是“所有人都要死”,特殊的情况是“苏格拉底是人”,所以从一般演绎到特殊,“苏格拉底是要死的。”

  是因为这个大前提人人都知道,我们平时说话是默认别人也知道这个前提的,所以我们往往不会说,但是脑子里会想。

  比如有这样一个数据分析的结论:当前需要提升新用户数,所以要进行广告投放。

  这个三段论中,看上去有三个概念“人,几百万年,你”,但因为前后两个“人”违反了“同一律”,是不同的,所以其实一共出现了四个概念“人类,几百万年,你,人体”。

  这个论述中,渠道A的新用户指的是进入APP的新用户,而付费新用户指的是首次付费的新用户,所以这个论述中有两个新用户的概念。一共出现了“APP新用户人均付费金额、渠道A投放获得APP新用户、付费新用户的人均付费金额、渠道A投放获得付费新用户”四个概念,犯了四项错误的问题。

  “所有人都是要死的,苏格拉底是人”,这里的“人”就是中项,用来联系大前提和小前提。

  那什么叫周延?“所有中国人”指全部,是周延的概念;“一部分中国人”,是不周延的概念。

  “一部分中国人”是联系大前提、小前提的中项,但是不周延,所以犯了“中项两不周延”的逻辑错误。北京人是一部分中国人,但不一定是有钱的那一部分中国人。

  所以“新用户喜欢使用A功能,甲是新用户,所以甲喜欢A功能”这句话也是错的。

  因大前提“新用户喜欢使用A功能”实际上是“大部分新用户会使用A功能”,这是可以通过数据得出的结论,比如60%的新用户都会用这个功能。等同于“一部分中国人很有钱”

  小前提“甲是新用户”,实际上是“甲是一部分新用户”。等同于“北京人是一部分中国人”

  本文仅做为一个逻辑推理的入门引导,其他的错误类型有兴趣可以自己去百度一下。

  因为我们见过的所有人都是会死的,所以我们归纳出一个结论:所有人都是会死的。

  我们平时最常用的逻辑推理方法就是归纳法,因为这种逻辑能力是写入我们基因中的一种本能。

  比如几百万年前,原始人看到老虎、狼等猛兽伤人,那么他下次再遇到长着利爪和尖牙的动物的时候,就知道赶紧躲起来。这就是归纳法在起作用,“利齿尖牙的动物代表着危险”。如果人类没有这种能力,根本活不到现在。

  我们很小就有了这样的能力,比方说小孩曾经摸过冒热气的杯子很烫,下次再看到冒热气的汤碗,他就知道这个东西也很烫。我们天然就具有这种能力,并不需要经过特别的教育。

  但是归纳法有一个问题,就是哪怕你所有的论据都是正确的,结论也可能是错误的。

  英国哲学家罗素提出过一个问题,被称为“罗素的火鸡”,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。

  在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”

  时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….

  在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”

  时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….

  归纳法最常见的就是这类“以偏概全”的错误。但我们日常生活中经常犯这样的错误。

  这些结论我们感觉理所当然,几乎都不用经过思考,但是稍加思考就会发现这些结论是有问题的。

  现在很多的机器学习模型的做法是通过大数据分析找出一些人群的共同点,不带任何大前提,我觉得这种建立在归纳法基础上的模型很难说会有怎样的效果。

  我们在做数据分析的时候,因为思维的怠惰,很容易进入归纳法这种思考方式,我们必须警惕这种不经过思考的归纳推理。

  之前提到过,演绎法的推理,只要大前提小前提和论证过程正确,那么结论必为真。

  但是归纳法只能得出尚未被证伪的结论。一旦发现一个反例,那么这个结论就会被证明是错误的,或者限制结论的使用条件。

  不过还是既然演绎法的大前提往往还是来自于归纳法,怎么样保证结果的正确性的?

  我们可以尽量采用那些前人已经总结过的结论,这些结论经历了时间的考验,相比自己临时归纳的结论更加可靠。

  大前提:你通过自己的使用经历发现,如果APP界面的交互风格差别比较大,自己用起来体验不好。

  大前提:你通过自己的使用经历发现,如果APP界面的交互风格差别比较大,自己用起来体验不好。

  这个结论是建立在你自己的感受上的,是你过去经历的归纳。虽然其他人也可能有类似的感觉,但是总感觉听起来没那么有说服力。

  大前提:根据尼尔森十大交互原则的一致性原则,功能应该保持一种类似的结构,规则的排列顺序能减轻用户的思考负担。

  大前提:根据尼尔森十大交互原则的一致性原则,功能应该保持一种类似的结构,规则的排列顺序能减轻用户的思考负担。

  这是因为你的逻辑基础更加扎实,大前提是一个前人经过大量研究得出的结论,相比自己总结的感受,要更加准确。

  有些时候,两种逻辑推理方法不太容易分辨。因为有些话听起来是一样,但是背后推理的逻辑是不同的。

  你可以体会一下,重新读一遍这句话,注意重音的不同:A和B都说附近新开的那个饭店不好吃,那肯定不好吃。

  你看,同样一句话,不同的人的内心思路很可能是不同。所以,在和别人沟通的时候,你必须知道对方的逻辑到底是什么。

  如果是当面沟通,还能通过语音语调大概猜出对方的逻辑。如果是在网络上通过文字沟通,那么就要多想想对方到底是什么意思。

  我们平时的数据分析结论,往往就是演绎法和归纳法层层叠加起来的一座逻辑大厦。

  以上是一个简单的案例,通过这样梳理一下思路,我们就能知道自己结论的逻辑基础和推理结构到底是什么。

  然后遇到归纳法就反思是否有犯以偏概全的问题,或者能不能用更公认的事实做大前提改成演绎法。

  排查演绎法时,看看有没有大前提、小前提、论述过程等错误,根据文章前面提到的错误类型一一排查。

  如果你拥有以上这样的逻辑思考方式,是不是会发现自己可以轻松应对数据分析师岗位要求里“逻辑推理能力强”这一项要求了。

  三元方差,公众号:三元方差(sanyuanfangcha),人人都是产品经理专栏作家。专注用数据驱动业务增长,擅长数据分析、用户增长。喜欢阅读、思考和创作。

分享到:
您使用的浏览器版本过低,不仅存在较多的安全漏洞,也无法完美支持最新的web技术和标准,请更新高版本浏览器!!