碎片(2)

没有(1)的,(1)是碎片化知识的处理。

过年几天在家,除了必要的走亲戚以外,就是拿着电脑看文章。知乎上有些牛人还是可以看看的,比如欧大推荐的肛锯。

今天翻到一篇,是他回答

“为什么政府一方面允许“性博览会”,一方面又“禁止淫秽物品传播”?在法律上有没有抵触?”

这个问题。他说,因为前者有关系,给了钱。后者免费。如果后者是有收益的,比如捐精,就可以合法地看。

多年前张五常搞了个有奖答题。问过一道类似的:为什么某些公共场合抽烟非法,但汽车却可以合法地污染空气?有一个获赞的答案。两者都是有好处和坏处,但抽烟的好处没有得到体现(作者按:纯粹是抽烟者自己的爽,当然如果说烟税,那在自家抽就行了),但坐车却有车费作为衡量。

如果光是这样,其实还好,关键后面还有一句精彩的:

在抽烟者的好处得到衡量时,抽烟的权利就得到保证了,例子是饭店的吸烟区。

这里是一个很深的问题:科斯只是说在产权明晰的情况下,交易可以带来利益最大化,而产权属于谁其实是无所谓的。在真实世界里,产权的归属本身需要很大的费用去完成(想象所有可能出矛盾的地方都出一条法律,法典得有多厚)。所以产权的归属会用一些“简单”的方式界定。比如抽烟,到底是允许抽烟者污染空气,还是允许不抽烟者侵犯抽烟者的抽烟权,怎么界定呢?在公共场合,不抽烟的人的害处得到较多的量度(二手烟导致肺癌之类),因此法律规定它们有权。在餐厅,抽烟者得到的好处反映在餐费上,因此产权人(餐厅主)会迁就他们。当然有的餐厅主会规定餐厅不许抽烟,这可能是因为大多数人不抽烟,或者是因为区格抽烟和不抽烟很困难。而如果你说国家规定公共场合不准抽烟(包括餐厅),这可能是出自消防的考虑,而事实上餐厅也不会真的去执行。

好了不扯这个。我想说的是,肛锯无意中就打中了问题的核心(他的回答跟抽烟那个问题基本平行),这是源自对真实世界现象的了解,加上他本人的聪明。

但他不是经济学家,也有时在某些经济学问题上犯错(我指的依然是答题)。那他跟经济学家相比(我是说靠谱经济学家,不是弱智那些),输在哪里?

输在不全面。科班出身的,肯定全面。什么是全面?全面往往来自长时间在一个领域上浸淫,得到全方位的较为深入的了解。数学上是对碎片化的知识进行长尾收割。

经济学不是碎片?其实任何领域都是碎片的。诚然是有体系、有先后,但整体而言,任何领域的问题就像一块形状不规则的布。一套理论,无非是在布里面裁出的一块规则的形状,去盖住这块布的一个区域。多个理论,就盖住了整块布,但也会有重叠或者少量遗漏的。因此无论做什么,多多少少都有碎片化的处理,其实往往都是不少的。而碎片化的东西如何进行收割?只能用非碎片化的策略(比如一个较为长期的策略)去吸收。如果用碎片化的办法去吸收碎片化的东西,那吸干净的概率就很低了。很多时候,吸干净(未必百分百但的确要比较大量)还是很重要的。

二八定律和长尾理论,无非都是对碎片的一种吸收方法。长尾理论的盛行(在商界吹牛皮领域里盖过了二八)应该是说明了当今碎片化比以前严重。这应该是因为信息发达导致一个平台可以吸纳更多以前不存在的东西。

碎片化的处理,往往是通过对碎片化具体的处理(所谓脏活累活,带来宝贵的感性认识),然后提取出规律(也就是基于规则的处理)。但如果搜索空间复杂,规则就变得很多,规则本身也成了碎片(当然对比起底层的碎片,还是不一样的层次)。目前的大数据人工智能又或者机器学习(例如神经网络),是说我们可以用更高一层的东西去处理碎片化的规则。于是碎片化规则成了中间步骤(也就是半成品),我们可以承认它的存在性同时忽略这一步。(老实说站在实用角度,你甚至根本不用考虑它的存在性。霸王硬上弓就是了,不行拉倒。)多层神经网络也无非是这个思路的一个自然延伸。

那是不是说最原始碎片的观察和规则提取就不重要呢?当然不是。首先世上多的是难以用向量去表达的东西。其次是以目前的AI技术,哪怕神经网路有很强的推测力,但理解力依然不够(也就是因果关系的挖掘,可怜的图老板上回就因为这个被人喷了哈哈)。而理解出这些规则,尽管在推测上也许可以跳过,但还是很有用的。举个栗子,头条的推荐规则是个blackbox,它挺牛(当然也还有很大改进空间),但内容生产者,甚至头条自己可能都不知道准则是什么。这产生了什么问题?内容生产者难以得到稳定的回报!你看那些大号,为了获得稳定的阅读,文章千篇一律,连标题都是一个套路的。头条最近在想办法改变这个事情,就是用粉丝经济来增强优质内容生产者的收入稳定性。这一定程度弥补了推荐系统无法理解的问题,但未必能如愿以偿。不过这点离我们主旨太远我们就此打住。

对于碎片的收割,二八定律属于select x if x = 0. 而碎片式收割属于select x if x > 0(笼统说法)。显然后者收得多,当然难度也大。纸上谈兵容易,不过仅仅是在脑子里多了这一点,思路也可以开阔很多。关于碎片收割的理论我还没想清楚,而考虑到现在已经凌晨2点多了我决定还是先去睡觉。又因为害怕明早起来忘记了这些(深夜体力疲劳,容易“神经病人思维广”,往往更有灵感),于是我先写下这些不成熟的看法留作笔记,最后一段不喜勿喷。

 

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

%d 位部落客按了讚: