How to write your first SCI paper?
这篇博客是清华大学刘洋老师在NLP会议上的报告PPT整理,原文机器翻译学术论文的写作方法和技巧. 写论文的本质是分享思想,呈现信息,虽然创新至上, 但是也需要掌握科学的写作技巧. 工欲善其事,必先利其器.
论文发表流程
- 确定方向 (影响重大,重大挑战,自己感兴趣的,即将成为热门)
- 确定问题 (问题正确与否)
- 确定思路 (思路新颖)
- 确定方法 (方法正确,易于重现,对比合理)
- 实验验证: 数据集,基线系统,评价指标
- 撰写论文: 投稿ICML (表达清晰,文笔优美)
审稿
你以为审稿人是这样的
审稿人一定是专家,无所不知。打印出来,仔细研读揣摩数天,对于看不懂的地方反复推敲。即使你的英文写得极其糟糕、即使你的文章组织很混乱、即使你的表述很晦涩,审稿人花费了大量的时间后终于看懂了,他认为你的工作是有意义的,决定给你个borderline或以上的分数。实际是这样的
他不一定是专家,一直忙于其他事,在deadline到来之前一天要完成n篇。审稿时他往往先看题⽬、abstract,扫一下introduction(知道你做什么),然后直接翻到最后找核⼼心实验结果(做得好不好),然后基本确定录还是不录(也许只⽤用5分钟!)。如果决定录,剩下就是写些赞美的话,指出些次要的⼩小⽑毛病。如果决定拒,下⾯面的过程就是细看中间部分找理由拒了
转变观念
from 以作者为核心整理工作 to 以读者为核心阐述工作
- 信息的呈现符合读者的认知惯性: 深入浅出,引人入胜,让读者快速找到想要的信息
- 尽量降低读者的理解难度:合理地综合使用各种信息元素:图>曲线>表>正文>公式
- 尽量提高读者阅读时的愉悦感: 思想新颖>组织合理>逻辑合理>论证充分>文笔优美>排版美观
摘要应该怎么写?
误区:
- 1.力图把所有细节都说清楚
- 2.用很专业的术语来描述
- 3.出现数学符号
用语要简单,让外行能够看懂
- 1.问题是什么?
- 2.我们做了什么?
- 3.我们大概是怎么做的.
- 4.我们做的挺不错的!
介绍的写作技巧
介绍的写法
- 比题目和摘要更进一步,用几段话说清你的工作
- 要点是充分论证你说做工作的必要性和重要性
- 行文逻辑严密,论证充分
常见的逻辑?
- 说明问题是什么
- 简单罗列前人的工作
- 描述我们的工作
更好的逻辑!
- 说明问题是什么
- 目前最好的工作面临什么挑战
- 我们的方法能缓解上述挑战
段落的写法
- 每个段落有个论断性的中心句
- 其余部分都是支撑句,围绕中心句展开论证
- 前人工作
- 具体数据
- 支撑句之间可分类组织,支撑句要论证严密
- 段尾可以加上衔接句
图和表的重要性
- 图和表是论文的骨架,争取让读者按照顺序看就能理解论文的主要思想,不用通过看正文才能懂
- 一般第一遍看,都会看图、找例子
- 然后翻到后面找主要结果
- 再从头看正文
- 把论文的的元素放在最应该被放在的地方,符合读者的认知惯性,降低理解难度
如何描述自己的方法
- 不要一上来就描述你的工作,可以先介绍背景知识(往往是baseline),在论文里面呈现的元素是Background和Preliminary
- 有利于降低初学者或其他领域学者的理解难度
- 有利于对introduction中的论文做详细的解释
- 有利于对比baseline和你的方法
方法描述的逻辑顺序
错误的顺序 - 形式化描述
- 解释数学符号的意义
正确的顺序
- 首先给出running example
- 然后利用running example,用通俗语言描述你的想法
- 最后是形式化描述
如何写 realted work
Wrong
- 没有引用重要论文(!dangerous)
- 简单的罗列和堆砌,缺乏深刻到位的review
- 通过批评乃至攻击前人工作证明你的工作的创新性
Right
- 向审稿人显示你对本领域具有全面深刻的把握
- 通过与前人工作的对比凸显你的工作的创新性 (传承与创新)
- 为读者梳理领域的发展脉络,获得全局的认知
写作常见的问题
- 句子过长
- 经常使用被动句式
- 结构松散,口语化
- 不定冠词和定冠词的使用,慎用it,there be等.
- 引用的写法(放在句首,放在句尾去掉不影响整个句子的含义)
时间管理和反馈
coarse-to-fine
- 截稿前一个月开始写
- 每隔两天改一次听取不同背景读者的反馈意见
- 专家:专业意见
- 非专家:发现信息壁垒
- 写到极致,完成完美精致的艺术品