标签: 优质分享
- 作者帖子
镜像之美游客@zhudw #87949
镜像之美游客@zhudw #87949
大侠好!http://218.2.105.121/#/details?id=0006038BY01-0001 我改成http://218.2.105.121/#/details?id=0006038BY01-0008只能下载部分,其它均不行。谢谢!
zhudw游客
镜像之美游客@zhudw #87965
谢谢大侠热心!
书阁铁粉游客比如这个网站用解析完http://140.147.239.202/service/asian/lcnclscd/unk85047514/1A001/0000000a/case.jp2
140.147.239.202/servi...0b001a.jp2
140.147.239.202/servi...1b002a.jp2
140.147.239.202/servi...2b003a.jp2
140.147.239.202/servi...3b004a.jp2
140.147.239.202/servi...4b005a.jp2
140.147.239.202/servi...5b006a.jp2
140.147.239.202/servi...6b007a.jp2
140.147.239.202/servi...7b008a.jp2
140.147.239.202/servi...8b009a.jp2 解析出来这些下载链接用什么命令可以批量下载
书阁铁粉游客直接解析出来的下载i地址怎样可以批量下载
xiaopengyou游客
剔藓扫尘游客
zhudw游客@剔藓扫尘 #88038
应该是全部失效了,在这个站上花的精力太多,暂不打算修复了,可能下个版本删除这个站
xiaoyuz游客@zhudw #87965
Enter an URL:
-> repository.lib.cuhk.edu.hk/sc/it...1/mode/2up
2023/04/04 11:37:52 Get 0001 repository.lib.cuhk.edu.hk/sc/it...1/mode/2up
ErrCode:202, Accepted
Enter an URL:
-> repository.lib.cuhk.edu.hk/sc/it...1/mode/2up
2023/04/04 11:38:19 Get 0001 repository.lib.cuhk.edu.hk/sc/it...1/mode/2up
ErrCode:202, Accepted
Enter an URL:
->请教zhudw兄 港中大自从1.09版本 就无法下载了 以前1.09还能下4张图 是不是改了验证机制
zhudw游客@xiaoyuz #88053
香港中文大学近期改用Amazon 新加坡云服务器,并启用Amazon WAF应用防火墙。详见:
xiaoyuz游客@zhudw #88054
原来如此 我研究一下
光游客@zhudw #88054
zhudw兄好!香港中大的没有香港代理都下载不了吧?
光游客看到你的cookie有:lotame domain check=cuhk.edu.hk
zhudw游客@光 #88063
有没有代理是一样的,自从它启用了WAF防火墙,即使是香港IP访问,普通下载工具,也会被墙(真人识别)。
不带cookie,大概也能下载一会儿,带cookie也只能下载一会儿。现在能做的是频繁换cookie,不是刚需的人大概也不会下载了。
当然,除非有更高级的软件,模拟浏览器实现真人识别。我只做到低级软件,高级的就不做了,开发成本高。如果频繁换cookie也失效,最后就只能是删除这个站的支持。
这里把思路写出来,供大家参考:
1、不论何种编程语言,只需内置Webkit浏览器内核,浏览器访问下载地址,会自动完成真人识别。
2、下载时检测cookie失效后,调用Webkit内核再一次完成真人识别。大概率用GUI图形界面是最好的。即使弹出验证码,也可以由人工输入。
3、现在比较流行的tampermonkey插件,编写javascript代码实现下载,是开发成本最低的。只是用户体验可能不太好。
总结是,对会计算机编程的人,下载其实没太大难度。要做成产品供普通用户使用,工作量较大,大概率不会有人免费做这件事。
陕西书生游客这个在github中需要先注册才能下载,但不知道什么原因,我用chrome和ie edge都无法注册。有哪位格友能分享一下吗?
不知有汉游客@zhudw #88070
大侠,可否增加下载天津图书馆历史文献数字资源库啊??
光游客@zhudw #88070
谢谢zhudw兄的指导!不过目前不断换cookie,还是没试过成功的!
渔樵天地游客回复至:bookshare
conf.ini与links.txt 找不到下载按钮。
bookShare.exe 打开,老是闪退。 烦请大神帮忙解惑,感谢!
zhudw游客@光 #88111
如果不是刚需就不折腾下载了,这个学校太小气了。他们宁可花钱买防火墙,都不愿意给别人下载。真是奇葩的思维。
zhudw游客@不知有汉 #88093
大概是要登录的,对于要登录账号的图书馆,以后不加了。
阿龙游客zhudw兄,香港中文大学图书馆 怎么样才能下载高清的.谢谢你
xiaopengyou游客
光游客@zhudw #88135
嗯!格局太小了!
一行游客@zhudw #88135
大神,下一版本能否升级 -seq 和 -vol 功能为自动补刀,以天一阁为例,单个链接下有20册,每册有100+图片 ,经常会有某一册缺一图或几图的情况
墨雲游客大学数字图书馆国际合作这个网站能加到booget下载吗
cadal.edu.cn/cardp...ource=card
zhudw游客
zhudw游客@不知有汉 #88093
发现天津图书馆下载时不需要cookie,可以算作是开放数据,因此加入支持了。
bookget v1.1.2
[新增]天津图书馆历史文献数字资源库Release bookget v1.1.2 · deweizhu/bookget (github.com)
下载URL格式:
lswx.tjl.tj.cn:8001/Views...taid=S3689
自性若悟游客@zhudw #88215
zhudw先生您好,我想下载东京博物馆的印谱,本人小白,很多基础知识都不太懂,只能看先生之前给别人的回复,奈何实在无法下载,以下是我的操作步骤,请先生指正
1需要下载集古印范,全书共10卷
出现了两个URL
image.tnm.jp/SealA...002508.jpg
webarchives.tnm.jp/infol...008SA_2508
输入后均不能下载,但是偶尔有几页jpg的可以直接下载,这是为何?
本书全卷10卷该如何快速的下载,我最初的方法就是点击jpg的链接右键保存,实在是太慢了,忘先生教我该如何正确操作,见笑..
以正游客天一閣的書下載的時候經常發生缺頁,需要重複下載才能成功,不知道大神能否排查一下原因?
zhudw游客@自性若悟 #88217
印谱这类的不支持。東京国立博物館支持的图书入口是:webarchives.tnm.jp/dlib/...strated=on
《集古印范》五册七卷,下载地址如下(详细解释参考bookget wiki 06 批量图书下载)。
https://image.tnm.jp/SealAlbum/P-10009/P-10009-1/SAC-0000(2508-2611).jpg https://image.tnm.jp/SealAlbum/P-10009/P-10009-2/SAC-0000(2612-2705).jpg https://image.tnm.jp/SealAlbum/P-10009/P-10009-3/SAC-0000(2706-2799).jpg https://image.tnm.jp/SealAlbum/P-10009/P-10009-4/SAC-0000(2800-2885).jpg https://image.tnm.jp/SealAlbum/P-10009/P-10009-5/SAC-0000(2800-2907).jpg
zhudw游客@自性若悟 #88217
其它几册自己补全一下,如下图,通过画红线的地方,你可以找到X册(N1 - N2页)
zhudw游客@以正 #88226
你多试几次,也不花很多时间。比我修复花的时间少。
zhudw游客@光 #88231
兄弟 ,国内的真不加了。例如近期加的山东、云南古籍都残了。今天加进去,过几天又失效,没有意义。
是一个死循环,加进去,过一段时间又废了。浪费的是人力。退一步说,软件是开源的,你看这两个月来,有没有人二次开发?没有嘛。
芬陀利华游客@zhudw #88215
先生好,天津图书馆历史文献数字资源库下载URL格式,是不是根据您提供的格式,改变2项(drid=和metaid=),如这本书
lswx.tjl.tj.cn:8001/Detai...atalogKey=
下载URL格式为:
lswx.tjl.tj.cn:8001/Views...taid=P6132
但下载不成功
zhudw游客@芬陀利华 #88233
你注册一个帐号,登录进去。点开【在线浏览】复制网址就能下载了。
光游客@zhudw #88232
好的!谢谢zhudw兄!辛苦了!国内的格局是有点小,各自为政!文化自信!但愿平民百姓也随时能看到好中医书!
芬陀利华游客@zhudw #88234
感谢指导!
自性若悟游客
自性若悟游客@zhudw #88229
我发现问题了,已经改正,多谢先生指教
以正游客天一阁下载书籍缺页的问题,我有时重新下载七八次也不能补全的,个人猜测是否速度太快导致的?可以试试加个限速功能。不过我不懂编程,还恳请大佬出手了。多谢多谢!
zhudw游客@以正 #88257
说个故事:我自己下载hathitrust的图书,因服务器限制、网络限制,也有可能花几天才能下完一套书。这是因为,我想得到,所以我必须花费时间。
天一阁的限制并不少,现在能用工具下载它,已经是幸运的事了。凑和用吧。
如果觉得花时间不值得,说明此书也没有那么重要。
自性若悟游客@zhudw #88234
你好,我在digicoll.lib.berkeley.edu/recor...153%2C7466 下载这本书时,只能下载1-9的整数图片,带有_1的均没下载,但是编辑进去不能识别,该如何操作
只能下载整数的
不语游客
zhudw游客@自性若悟 #88263
括号内只能有数字,如果有其它字符需要放在()外面
zhudw游客
不语游客@zhudw #88278
谢谢大佬。
遊客游客@zhudw #88260
支持。
可能是我的视角比较偏。我感觉楼主近期可能是陷入经济困窘了。(希望不是更好)
不知道大家有没有留意到。楼主此前是从不要求捐赠的,甚至在去年的帖子还曾要求未曾先生把帖子的支付宝和微信码删除。其实个人一直很惊讶楼主在 bookget 上所投入的时间和精力,楼主对这个工具基本上是三天两头更新,有时甚至一天多次更新。有注意到楼主在 github 发布更新的时间经常是在深夜凌晨甚至半夜三更,几乎是全身心投入到工具的开发工作去的。
另外还不厌其烦的解答书格网友的各种提问。不计个人得失。书格网站引用了一段话,“知识有两种。你自己知道某种知识本身,或者你知道哪里能找到这种知识。”
其实我认为还应该再补充一种。第三种,你知道怎么把“找到的这种知识(载体,即书籍等媒介)”收入囊中。
而楼主就是具备了第三种知识。常闻当今时代是知识付费的时代。
个人认为想要收获还是需要有所付出的。
要么自己耐心地花时间精力研究学习技术、方法。(我倾向于选择此项。)
要么向他人付出一定的酬金作为酬谢,可以看作是花钱为自己省事。和万千普罗大众一样,楼主也是食人间烟火的世俗之人,总免不了世俗之事,而解决世俗之事通常离不开金钱。如果 bookget 的用户希望楼主能将此工具长久地维护下去,如果希望楼主能持续地为大家解决各种疑问,那么请力所能及地通过捐赠来支持他的工作,让他可以安心于此。
xiaopengyou游客使用者都不好好看 LZ的主頁說明,電腦小白如我每次看到朋友的提問,我都佩服LZ的好脾氣。
都是電腦小白卻都不好好看操作說明,也不好好看每層樓的信息,但相似問題卻一再提問,LZ都無償分享bookget,卻同時還要充當客戶,這情何以堪?
再者新版開發多以國內圖書館為主,也大都需要帳戶登錄,它的困擾LZ也在樓上回應過,圖書館也大多在網站上標示禁止批量下載,但LZ無償開發批量下載工具,會不會有被追究的風險,bookget的使用者是否為LZ想過?
個人看法是能用就用,都不必強求,LZ願意提供也好,不提供也罷,多欲為苦,得之我幸,不得我命!
- 作者帖子