分布

分布才是事实的全部。

1.

叙利亚难民事件,一张很轰动的图片,是一个孩子在水中淹死。舆论纷纷表示要接纳难民。

至于带来的经济损失,治安混乱,似乎都不重要。

新闻是不是在报道事实?是,也不是。

在小的层面,你报道的是事实。而在更大一个层面,你报道的是一个事件的一小块。它明明占1%,却得到90%的声量。

换言之你扭曲了事实的分布。

有人说,人命关天。就算是1%的人死亡,也应该获得关注,不是吗?

还真的不是。

如果今天每人每年经济收入获得200%的额外增长,而万分之一的人每年因此死亡,可以接受吗?

答案是可以的。否则就不应该有交通工具。

没有什么是所谓绝对价值,人命不是,环保更加不是。一切都可以跟别的东西互换(至少在较大的层面上)。既然如此,分布就很重要。

2.

我们的认知,本身也是一个分布。我们认为对的东西,可以换一种说法:这个东西正确的概率是多少。换言之,是可能性的一个分布。

我们的决策,时间精力的投资,也跟这个分布紧紧相连。

缺乏安全感的人,容易把很小的事情放大,扭曲认知的分布,从而作出错误的决策。

当我们面对一个全新的事物,也要先把握各种层面的分布。例如你想知道一个行业的现状,首先应该看看市场份额的占比,有哪几家大公司,然后他们主要的收入手段、经营方式是什么。这样才是从大局把握。

3.

那小的东西是否就没有意义呢?也不是。

目前机器学习大多基于统计学,换言之学习的就是上述的分布。但人的智能却可以从少量的数据中学习。所谓“见微知著”。

比如你看到一个人从垃圾桶捡东西吃,那他极有可能是很穷。不需要大量事实你就可以判断。这个判断的根据来自哪里呢?

一切都是因为,被观察的对象也是人!人的行为本身就受到极强的约束,否则人类无法生存到现在。因此一件事情能够发生,本身就信息量巨大。

但这个推断的一般性能有多强?上面的例子,我们仅仅能推断出这个人自己很穷,而推不出整个社会的一些属性。

如果要推到更高层面,也不是没有可能。第一种可能,这个人本身的ranking很高。比如这个人是蜀国的大官,但他女儿都饿死了,这的确能说明蜀国很穷。第二种可能,这个人所面临的境况跟大多数人一模一样,但这个本身也依靠大量的观察。

4.

一个常被引用的例子,是在投资领域:你光知道一个事情没用。你需要很确定。这样你才敢投大量的钱进去,获得丰厚的回报。

确定性从哪里来?无非也是分布。你知道这件事的100种可能,而99种都会导致这房子涨,那房子就肯定是涨。

于是这里产生了一个认知升级的通道:首先,你知道了一件事情A.  然后,你去观察大量与A近似的事件。然后比较互相之间的区别,目的是获得“什么是关键变量”的答案。然后你分析不同变量对于你所关注的结果的因果关系。最后你获得一个较为全面的认知。

5.

说是几行,做起来就难了。还是要先想清楚自己想做什么。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

%d 位部落客按了讚: