阅读机器学习论文的方法

张五常曾花三年时间读科斯的社会成本问题。前两年无聊的时候读过一下,确实很有意思,读完后我对成本的理解加深了不少。但天下间值得这么花时间读的文章非常少。加上每个人懂的东西都局限在一个范围内,在范围内这样的文章数量,估计2篇都算多了。

机器学习的文章,大部分是灌水,少部分有些想法,但写的套路都是差不多的。这里介绍的方法几乎适用于所有文章。万一有不适用的,你就老老实实地,一页页翻吧。

套路通常是这样的。先是Abstract,然后Introduction,  这些都是固定的部分了。接着讲讲历史,通常叫做“related work"或者"background". 然后是技术,分为框架和细节两部。然后是实验,包括方法和结果。最后是结论。

现在我们要破解这个套路。所谓破解,是我们要投入正确的时间到正确的文章。具体而言,我们要将文章分类,用10分钟读灌水文章,30分钟读有些想法的文章,1个小时至无限长时间去读剩下的好文章。而这个分类跟阅读是同时进行的。当然,这个时间我是随便说说,大家根据情况自己调整。

 

方法如下。

  1. 先看abstract和conclusion。 abstract好处是没有废话,知道问题和招数。conclusion基本包含Abstract,也说说招数发挥了什么作用,以及将来要做什么。读完这两步,文章主旨知道了。将来和现在连一条线,主题也就出来了。
  2. 接着跳去实验结果,看看文章有多牛逼。也顺便扫扫实验细节,不是参数,是花了多少时间和GPU,这决定了你有没有可能重现它。
  3. 然后看introduction。这里可以看到问题的上位概念。如果你不熟,可以补补课。在这里,你还能看到作者的想法。
  4. 读完以上几步,你对文章重点已经知道了。接下来就看看文章招数的具体定义。不用太细,除非你要实现它。
  5. 如果看到这你觉得还不错,那就可以看看招数的分析。包括“为什么要加这步”,“加了有什么效果”,“为什么这招会有用”。 还可以看看相关的工作,即历史那一章。
  6. 另外,文中的图和表,信息浓度高,通常都看一下。

灌水的文章,看完1,2你就能判断出来。跳去4看看,然后看看6就好了。

有一点思想的文章,就看看3. 如果对招数感兴趣,就看看5.

如果看完你觉得意犹未尽,文章想必是极好的,那就从头再翻几次吧。好文章不需要快,吸收的办法每人不同,我们就不探讨了。

 

 

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

%d 位部落客按了讚: