Zotero搭配Sci-Hub,真香! – 知乎

Zotero搭配Sci-Hub,真香!

由于之前在推文更新版|Zotero搭配Sci-Hub,真香!中使用的Sci-Hub的.se近期挂掉了,因此有必要对本文进行更新下。

目前(截止2020.04.15),可用的Sci-Hub域名有以下几个:

如果你想及时获取Sci-Hub最新可用网址,可以到青柠学术的GitHub网站[1]查看,我已经帮大家汇总好了。

我近期在Zotero中使用的是.ren域名,理论上以上四个都可以使用,大家可以自行更换为其中一个。

顺便把我的完整代码贴出来:

{
    "name":"Sci-Hub",
    "method":"GET",
    "url":"https://sci-hub.ren/{doi}",
    "mode":"html",
    "selector":"#pdf",
    "attribute":"src",
    "automatic":true
}

这里再提醒一下:

“ 如果你没有使用任何代理,由于网络环境问题,可能会有少部分从Sci-Hub下载的PDF出现损坏的情况,这时你可以考虑将上述代码中的https改为http,或者更换其他可用的域名,情况可能会好转。另外,可以逛逛本文在知乎的评论区[2],讨论的人还蛮多,说不从会有其他网友贡献更多好的办法。

除了改动部分,以下内容保持和之前的一致。


Sci-Hub有多香大家都知道!

Zotero有多香,你看了我的教程就知道了!

Zotero ,打造最佳文献生态(合集)

那要是Zotero+Sci-Hub,岂不是无敌了!

今天就教大家在Zotero内集成Sci-Hub,实现在Zotero中免费下载99%的文献!

从Zotero PDF retrieval谈起

从Zotero 5.0.56版本开始,Zotero迎来了PDF retrieval功能。详情可见Zotero官网的文章“Improved PDF retrieval with Unpaywall integration”[3]

该功能会在你用Zotero Connector保存文献时,自动检查Unpaywall上是否有可供下载的免费文献。

“ Unpaywall能免费下载文献,但你不要以为它和Sci-Hub一样是非法的。其实Unpaywall是个非盈利性合法组织,它整合了数千个Open Access期刊或数据库,将免费文献集中之后开放API,从而供其他平台使用。

假如你在网页端保存的文献是Open Access的,Zotero Connector就会将PDF同文献条目一起抓取,比如下面这样。

当然,对于已经在Zotero中却还没有PDF附件的文献条目,点击右键菜单中的Find Available PDF,即可下载文献,比如下面这样。

但是,毕竟Unpaywall只支持OA文献,而OA文献又只是少数。也就是说,通过Unpaywall无法解决付费文献的下载问题。

不过幸运的是,作为一款开源软件,Zotero的开发者为很多功能带来了可定制的能力,方便用户根据自己的喜好自定义。

PDF retrieval功能也不例外,Zotero允许用户自定义PDF解析器(custom PDF resolvers),也就是说你可以将其他网站作为PDF解析器,来替代Unpaywall。

详情可以访问Zotero官网链接Custom PDF Resolvers[4]

这为我们将Sci-Hub作为PDF resolver带来可能!

考虑到PDF resolver是内置在Zotero中的,这能保证我们能稳定使用该功能,就算Zotero更新了也丝毫不用担心,这一点就比使用第三方插件要有保障得多!

下面具体介绍如何将Sci-Hub作为PDF解析器!

设置Sci-Hub作为PDF解析器

PDF resolvers的设置在Zotero的Config Editor中。

我们打开Zotero的首选项,进入Advanced-->Config Editor

搜索extensions.zotero.findPDFs.resolvers,如下。

双击extensions.zotero.findPDFs.resolvers,默认情况下是只有一对[]

删除[],并将以下代码粘贴进去。

{
    "name":"Sci-Hub",
    "method":"GET",
    "url":"https://sci-hub.ren/{doi}",
    "mode":"html",
    "selector":"#pdf",
    "attribute":"src",
    "automatic":true
}

然后点击OK。

到此就成功将Sci-Hub配置为PDF解析器了,也就是说替代了默认的Unpaywall。

现在,无需重启Zotero,即可调用Sci-Hub免费下载文献了。

这里顺便提三点:

  1. 1. "url":"https://sci-hub.ren/{doi}"中,目前可用的域名有.tw.ren.si.shop,大家可以挑选其中一个,哪个用起来体验更好就用哪个。(当然,由于Sci-Hub经常更换域名,保不准改天哪个域名就挂了,或者有新的域名出来,因此此处的代码未来也会根据需要进行更新)
  2. 2. "url":"https://sci-hub.ren/{doi}"还能看到一点。由于Sci-Hub是通过doi下载文献的,因此该PDF解析器也需要doi。也就说你的文献必须要有doi,如果doi是空缺的,便无法通过PDF解析器免费下载文献。幸运的是,对于缺失doi的文献,我们可以通过插件zotero-shortdoi[5]插件一键抓取doi(参考文章zotero-shortdoi + Sci-Hub,让99%的文献都能被免费下载!)。
  3. 3. "automatic":true,如果设置为true,Zotero会自动下载保存到Zotero中的文献的PDF。比如你用Zotero Connector保存了一些文献到Zotero,它便会自动帮你从Sci-Hub下载文献,并附在相应文献条目下。如果你不需要自动下载,可以设置为"automatic":false

使用方法前面介绍过,主要有两种:

第一种:Zotero Connector

通过Zotero Connector保存的文献,会自动下载PDF,无需任何操作。(看不到进度条,下载速度取决于网速)

第二种:Find Available PDF

选中单篇或者多篇文献,手动点击右键菜单中的Find Available PDF,会弹出单独的窗口显示下载进度。同样,下载速度取决于网络速度。

关于下载速度取决于网络速度有下面两点需要注意;

  • 如果你未开启任何网络加速器(比如梯z),即正常使用网络,可以认为Find Available PDF的进度接近你手动从Sci-Hub下载文献的速度。大家应该都体验过,不开启加速器的情况下,Sci-Hub的访问速度还是比较慢的,甚至有时候PDF加载不出来。
  • 假如你开启了加速器,推荐使用全局代理模式,而不是PAC模式,因为两种情况下Find Available PDF的进度差异比较大(当然如果你不介意下载速度,使用PAC模式也是可以的)。不过提醒一下,下载完文献,记得切回到PAC模式,因为全局模式下Zotero无法同步文献到坚果云。

到此,本文就介绍完了!

可以看到,搭配Sci-Hub后,Zotero变得更加完美了!这就是开源软件的魅力,它能带来无限的想象空间。

如果你在使用中有什么问题,欢迎留言讨论!

相关链接

[1]

Sci-Hub最新可用网址查询: https://iseex.github.io/scihub/

[2]

Zotero + Sci-Hub知乎评论区: https://zhuanlan.zhihu.com/p/112141757

[3]

Improved PDF retrieval with Unpaywall integration: https://www.zotero.org/blog/improved-pdf-retrieval-with-unpaywall-integration/

[4]

Custom PDF Resolvers: https://www.zotero.org/support/kb/custom_pdf_resolvers

[5]

zotero-shortdoi: https://github.com/bwiernik/zotero-shortdoi/releases

这是尾巴

读过本文,如果觉得有收获,欢迎点赞转发收藏

编辑于 2020-04-18 11:32

文章被以下专栏收录

107 条评论

写下你的评论…

  • 智剑02-18

    最近我用这个,也存在找不到,然后我用doi去sci-hub.se找的时候发现几个问题,一是用short Doi找不到,但我用long Doi,可以在scihub找到文献,二是,利用zotero-shortdoi获取 long doi,然后zotero配置的sci-hub搜索引擎(doi)去搜索,发现找不到,观察之后是doi中的斜杠符号/发生了变化,变成%加两个字母,所以scihub就找不到,这长短doi的差别,及符号的改变,不知是什么原因,能请大佬指点一下,解决问题吗?

  • Shaun abc回复智剑03-07

    你好,请问下斜杠符号/发生转换的问题目前解决了吗,我也是在使用sci-hub搜索引擎是发现了这个问题

  • 知乎用户iiwR8p (作者) 2020-03-11

    这个我知道,最新的0.06版还是我前几天在Twitter 联系开发者ethan更新的,修复了不少bug。上一个版本0.05还是19年早期发布的,有不少问题。不过我不是特别推荐使用这种方式,会有一些人机验证弹窗等问题。我本文介绍的方法能实现在后台自己下载文献,不会对我们产生干扰。当然,感兴趣的都可以自行尝试下。

  • 滏阳河边捉蚯蚓回复知乎用户iiwR8p (作者) 2020-03-11

    每个域名下多了都有弹窗,并不是设置了 resolver 弹窗问题就解决了。

    真正没弹窗的是 scihub 的tg机器人。

  • 知乎用户iiwR8p (作者) 回复滏阳河边捉蚯蚓2020-03-11

    域名的流量控制肯定是有的。只是插件版的弹窗仅仅是个提示,无法直接人机验证,需要自己到scihub网页版输入验证码,解除人机验证。

  • BaoW2020-03-17

    你好,谢谢分享。但是按照你的方法,我右键点击“找到可用的PDF”时,依然显示无法找到PDF,但是我在浏览器中下载就可以下载,开代理和不开代理都试过,PAC和全局也试过,使用http://sci-hub.tw和.ren也试过,把https改为http也试过,都不行。请问我什么地方没有弄对吗?

  • 五十弦回复BaoW2020-03-25

    我也遇上了这种问题,不知道是哪里出了问题

  • BaoW回复五十弦2020-03-25

    我后面弄了几次,应该是需要输入验证码的问题,感觉这个插件还需要改进,目前能不能用可能看运气。我还是用网站下载的

  • 医路同行2020-03-24

    请问ZOTERO和MENDELEY在体验上各有什么优势?谢谢!
  • 叶落无声2020-03-19

    如果笔记本用的是windows的,那ipad又只能用ios版的,软件数据能互通同步吗?

  • 吸气牛2020-07-17

    非常好用,谢谢分享

  • 郝元斌2020-06-18

    非常有用的功能,谢谢。目前遇到一个问题,在下载一些 图书章节 的条目类型时,这类条目是没有DOI这一项的,但是会在URL 和其他项里有DOI。也能在sic-hub上下载到。请问能否加一个判断,在没有DOI项目的时候,在 其他 或者URL中找DOI信息?

  • sky2020-06-04

    您好,我想请教两个问题
    一是scihub每次抓取都会提示我Zotero Selector,然后要选择再确认才可以抓取,但是其他网页不会,怎么把这个提示给去掉呢?
    二是总是弹出输入验证码的提示,怎么让它不弹出来呢
    谢谢
  • TPOB2020-05-26

    (好用好用

  • 云浪2020-04-12

    那arvix得文章好像就不能自动下载了
  • 马生2020-04-03

    那个string value里面的url的值可以多值吗?比如多输几个备用域名之类的,就不用每次失效自己去改了

  • Mike Pan2020-04-01

    我靠,妙啊,你可真是个小天才
  • 盐选2020-03-28

    我在简书上看过这个。挺有用。可以搭配pop

点击数:0

发表评论

邮箱地址不会被公开。 必填项已用*标注