论文的查询方法

在确定了研究领域之后,我们需要对研究方向进行更细致的分析。一般需要经过:概念理解,论文阅读,方法梳理,发现问题(做好问题定义是很关键的),数据搜集,实验验证,论文撰写。但是每一个流程都需要充分利用已有的资源,提高自己的研究效率。

概念理解

  • 当你还不了解这个领域时,你需要先了解这个领域的基本概念。一般而言研究方向只要不过于冷门,一般在 知乎 或者 公众号 上都能找到一些牛人的分析和回答。
  • 这些回答之中不仅可以了解到基本概念,还能发现一些较好的论文,了解该领域的研究现状和方向。以一两篇较新的优质论文(如果领域比较模糊,可以先观察综述类的文章)为起点,进行后续的调研工作。
  • 在搜索中还需要对该领域的顶会/刊进行了解和总结。主要关注 CCF 的 A 类期刊与会议,如人工智能领域
  • 常见的顶会: KDD 、 WWW 、 AAAI 、 ICLR 顶刊 TKDE
  • 在阅读了推荐的论文之后,需要对这些文章中的关键词进行梳理,通过这些关键词进行更多优质论文的搜索。
  • 最为重要的是要了解论文的问题定义,这个是大量研究的基础,如果没有一个良好的问题定义,在之后的实验中,你可能会自我怀疑。

查找相关领域的论文

  • 一般可以从 DPLP(https://dblp.uni-trier.de/search) 中搜索外文论文,从知网搜索中文学位论文。从 arxiv 中查询或者下载外文论文文献,如果下载速度较慢,可以访问国内版本或者中科大版本,也可以使用脚本自动替换。有的时候可能存在多个版本,此时可以使用 pip install comparxiv 这个 python 库来进行比对。
  • 对于综述性质的论文一般包含 Review (述评)、 summary (总结)、 survey (概述) 等字样。
  • 在 DPLP 之中寻找时,可以只关注 Conference and Workshop Papers ,如果对找到的论文所属的会议不太清楚,可以通过会伴进行检索,了解其在 CCF 等组织给的评价等级。
  • 在这些论文之中进行分析筛选,了解异同,同时掌握主流的公共数据集,基准算法以及评估方式。这些内容需要积累整理起来,用于后续的实验之中。
  • 如果觉得对这个问题定义还不熟悉,可以从优质论文引用的论文中了解其问题定义和思路分析,以实用的角度看待问题的价值。
  • ACM 系列的论文并不会快速开放获取,但是对应页面存在 Supplemental Material 中包含了作者的论文讲解,可以帮助对论文有一个基本的了解

查找论文的被引用情况

  • 当你找到了一篇年份较久,或者方法过时,或者该论文属于经典的综述性质的论文时,你需要对这篇论文的后续发展进行了解,此时就需要查找该论文的被引用情况。
  • 常用的网站是 谷歌学术 和 ResearchGate ,以 ResearchGate 为例,通过搜索,可以发现论文信息中包含了 Citations 的信息,这个就是被引用的情况。
  • 不同网站由于收录的信息不一样,所以发现的论文被引用的数据有所不同

论文阅读

  • 注重质量,兼顾数量,考虑效率
  • 研究初期,最好选国内有名的课题组的博士论文进行阅读。其中的研究现状可以便于快速了解该方向的大量进展,同时了解对应的专业表达和关键词(key words)。如果实验室有过一定的论文成果,可以多和相关老师,师兄师姐交流,并且根据论文和代码,来学习基本思路。
  • 依据关键词去相关领域寻找较多引用的review或者顶会顶刊上发表的相关论文。将这些论文下载下来,并通过mendeley之类的工具进行文献管理,做好论文分类。
  • 阅读的同时做好笔记,笔记包含:论文解决了什么问题,用了什么方法(用一句话概括),程序如何实现,存在的不足,自己的疑惑和改进思路。

文档信息

Search

    Table of Contents