如何教你在NIPS会议上批量下载历年的pdf文档(另附04~14年NIPS论文下载链接)

时间:2024-02-25 12:32:05

如何获得NIPS会议上批量下载的链接?

NIPS会议下载网址:http://papers.nips.cc/

a.点击打开上述网站,进入某一年的所有会议,例如2014年,如下图

b.然后对着当前网页点击鼠标右键-》点击审查元素(这里我用的是360浏览器打开),(如下图)

下一步--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


下一步-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


c.将刚才的代码保存在新建的文本文档中,然后进行处理分析,删选出下载链接(重要的一步,注意看)

这里选择NotePad++来对文本文档进行操作,因为该软件功能比记事本强多了!!

1.首先进行删除,只保留<ul>到</ul>之间的内容,因为这才是所有链接的集合



2.接下来就是替换工作了,这里可能大家会觉得繁琐,(要是大家有好的方法可以自己摸索)

 

我们先把<li><a href="替换成http://papers.nips.cc      再把">替换为.pdf    @@@@                        



-------------------------------------------------------------------------------------------------------------------------------------------------------------------
现在就得到以下的代码了,如图

而我们现在要做的就是只保留红色框里面的代码就够,@@@@及其后面的代码删除,该怎么办呢?

 

 


接下来看小编怎么解决,这也是最重要的一步!!!!!!!!

其实也就是替换,不过这要用到正则表达式(这就是我要用Notepad++的原因)                     @@@@.*替换为       (这里敲3下空格键即可,我就是要替换空白)



为了美观,我将执行编辑-》行操作-》移除空行(包括空白字符)如下图



得到下载链接,接下来就是用迅雷批量下载即可



总结:这就是我如何获得NIPS历年的pdf文档了,是不是很简单啊,本来我是打算写代码获取链接的,但是水平有限和时间有限,而后如果大家想下其他年份的论文集,可以仿照我的方法,觉得好的朋友可以给个赞!谢谢!(另附:如果大家想把pdf文档进行转换text文本文档,请关注我的博客:http://www.cnblogs.com/Yiutto,上面有如何批量转换的方法)

04~14年NIPS所有下载链接:http://pan.baidu.com/s/1ntiUsDr