bookget 开源了（更新至：24.0923）

标签：优质分享

正在查看 50 个帖子：51-100 (共 2,169 个帖子)

← 1 2 3 … 42 43 44 →

作者
帖子
2023年02月17日 19:28 @81016 回复 ⚑举报　

zhudw
游客
bookget v1.0.2
[新增] 天一阁博物院古籍数字平台
[修改] 默认读取bookget本地目录下cookie.txt文件
提示：
需要cookie.txt ，压缩包内置有。若不能下载，请手动修改cookie文件。
可以下载已扫描图像的书籍（包含需要到阅读室，不能下载无图的书籍）。
如果看到【Please try again later.[401 Unauthorized]】多试一两次就可以。
2023年02月18日 09:43 @81095 回复 ⚑举报　

tigershuai
游客
又更新了，非常感谢。
2023年02月18日 11:12 @81104 回复 ⚑举报　

光
游客
@zhudw #81016
zhudw兄好！天一阁的医书好像都不可以下载的吧？国医典藏现在也都没有完整的医书了么？
211.102.218.19:7007/search.htm
2023年02月18日 12:26 @81122 回复 ⚑举报　

zhudw
游客
@光 #81104
天一阁好像没有公开医类书籍。国医典藏3.0只开放了前30页图像。
2023年02月18日 12:41 @81127 回复 ⚑举报　

爱好者
游客
请问天一阁的地址是什么？以前的http://www.tianyige.com.cn:8008打不开了

2023年02月18日 13:09 @81133 回复 ⚑举报　

zhudw
游客
@爱好者 #81127
天一阁博物馆 gj.tianyige.com.cn/
更多说明文档资料在项目主页 github.com/deweizhu/bookget
2023年02月18日 14:08 @81141 回复 ⚑举报　

墨雲
游客
@zhudw #81122
有公开医书，但但不多，因为无法进行资源筛选，所以搜索相当困难，只能一页页检查
2023年02月18日 14:44 @81145 回复 ⚑举报　
zhudw
游客
@墨雲 #81141
测试搜索【本草】找到书号【善2375】可以下载。如果提示【温馨提示：暂无扫描数据】这种就不能下载了。
```
本草綱目五十二卷附圖三卷瀕湖脉學一卷脉訣攷證一卷奇經八脉攷一卷
https://gj.tianyige.com.cn/SearchPage/0fb94b1bdc0fb86a9c3b4b615116c658
```
2023年02月18日 16:33 @81160 回复 ⚑举报　

光
游客
@zhudw #81122
谢谢！可惜了，国医典藏原来那么多经典医书，甘肃图书馆也多，都是不完整的！
2023年02月18日 17:16 @81167 回复 ⚑举报　

墨雲
游客
@zhudw #81145
我知道没有数据就无资源，我想说的是必须一个个点进书目信息才能确认有没有资源，相当麻烦，又没有有资源的目录，或者筛选出只显示有资源的书目。
2023年02月18日 19:20 @81188 回复 ⚑举报　

wd369
游客
@墨雲 #81167
在查询图书时有json 信息，从其中的几项数值可以得知是否有扫描。
2023年02月19日 00:52 @81227 回复 ⚑举报　

墨雲
游客
@zhudw #81145
对了天一阁下载这个能加多一个图片连接查重吗，因为很多书签的图片是重复的，而图片的实际地址也是一样的，而全部重复的图片都被下载了下来，而图片的实际网址也是一样的，
2023年02月19日 01:26 @81232 回复 ⚑举报　

庄子
游客
請教一下套書没法设置只下其中某一册是吧？比如这本有20册，点着看了看地址都一样，谢谢！
gj.tianyige.com.cn/Searc...d185e95a47
2023年02月19日 03:44 @81241 回复 ⚑举报　

江山無限
游客
@zhudw 请问，如果天一阁多册的如果中断下载，可否有简单继续的方法
2023年02月19日 08:29 @81263 回复 ⚑举报　

庄子
游客
@江山無限 #81241
重下即可，会跳过已下载的
2023年02月19日 09:45 @81267 回复 ⚑举报　

以正
游客
不懂就问，dezoomify-rs-zhudw这个软件是干啥用的？
2023年02月19日 10:23 @81273 回复 ⚑举报　

墨雲
游客
@以正 #81267
应该就是那个拼图软件的修改版，更适应bookget吧
2023年02月19日 15:04 @81313 回复 ⚑举报　
zhudw
游客
@庄子 #81232
我一直也感觉，对于多册书，分册下载是会比较好一些。有时候偷懒，就没去这样写。
天一阁的下载，增加了一个测试功能，请到百度盘的【测试版】目录去下载。
使用系统终端运行bookget，只要添加参数 -vol 2，即表示下载第2册。默认不填写，会下载所有册，并且一册一个目录单独存放。
命令如下：
```
.\bookget.exe -vol 2 "https://gj.tianyige.com.cn/SearchPage/aa13185a8fc77c6e186eccd185e95a47"
```
2023年02月19日 15:14 @81315 回复 ⚑举报　

zhudw
游客
@以正 #81267
1.0.2发布说明有写，专门下载四川、云南图书馆用的dezoomify-rs修改版。
@墨雲 #81227
天一阁的图片，是存在多页图片相同。暂时没有硬件条件去处理这个问题。解决方法会导致编译跨平台版本困难（需同时有三种系统，至少一台Mac，一台Windows或Linux计算机）。
2023年02月19日 16:02 @81321 回复 ⚑举报　

庄子
游客
@zhudw #81313
有勞您修改完善了，主要是有些大套書相互間關係并不大，只需要其中小部分，非常感謝！
2023年02月19日 18:31 @81340 回复 ⚑举报　

最初
游客
啥命令可以几本书一起下载
2023年02月19日 18:53 @81342 回复 ⚑举报　
zhudw
游客
@最初 #81340
```
批量下载多个URL。在终端内输入以下命令：
  bookget -i urls.txt
```
提示：urls.txt可以是任意文件名，内容是要下载的图书URL，一行一个URL，回车换行。
2023年02月19日 23:45 @81372 回复 ⚑举报　

yngwie
游客
@zhudw #81342
不知道zhudw老师是否可考虑在软件中，加入「江苏省珍贵古籍数字资源集成平台」（http://218.2.105.121/#/library）下载？感谢！受惠软件及平台甚多，借此致上谢意。
2023年02月20日 08:46 @81412 回复 ⚑举报　

zhudw
游客
@yngwie #81372
江苏和云南、四川都是同一个软件系统。略作修改，已经支持了。请下载最新的1.0.3版试一下。
江苏古籍服务器限制并发连接数较严格，即使单线程下载，也会在N秒以后限制访问。届时，将无法打开该网站。更换IP后，可继续下载。
2023年02月20日 09:19 @81417 回复 ⚑举报　

zhudw
游客
@未曾先生，如果看到。请帮忙更新一下，一楼的原帖。谢谢！
项目主页：http://github.com/deweizhu/bookget
此工具用于下载数字化古籍图书，目前支持约30~40个图书馆。
采用GPL-3.0开源协议，欢迎有开发能力的朋友二次修改、分发（前提是你遵守了GPL-3.0 license）。
最新下載地址：
github：https://github.com/deweizhu/bookget/releases
百度盘：https://pan.baidu.com/s/1RGvNEp3gDqB4z_r3SGwKmw?pwd=55uk
一般同步更新，推荐从github下载，它包含源代码、及说明文档。
更新日志
bookget v1.0.3
[新增]江苏珍贵古籍数字平台
[修复]柏林国立图书馆，多册分目录存放
[修复]天一阁用户鉴权，理论上不会再出现401错误
bookget v1.0.2
[新增] 天一阁博物院古籍数字平台
[修改] 默认读取bookget本地目录下cookie.txt文件
bookget v1.0.1
[新增]四川数字古籍图书馆
[新增]云南数字古籍图书馆
提示：
1、四川、云南、江苏古籍数字平台，需要使用 dezoomify-rs-zhudw 修改版。（无需单独下载，最新版已包含）
2、使用前，请先阅读项目主页上的说明文档。
2023年02月20日 13:09 @81472 回复 ⚑举报　

道统
游客
你好我想请问下下载好了的文件名是需要手工重新命名的吗想知道是不是自己弄错了
2023年02月20日 13:17 @81476 回复 ⚑举报　

听雨
游客
请教大神，下载江苏省珍贵古籍数字资源集成平台的书出现这种情况怎么处理？
2023年02月20日 13:21 @81477 回复 ⚑举报　

zhudw
游客
@道统 #81472
下载后的文件名 00 需要手动修改。
@听雨 #81476
运行 bookget ，你打开错软件了
2023年02月20日 13:26 @81479 回复 ⚑举报　

道统
游客
@zhudw #81477
谢谢十分感谢国图下载中
2023年02月20日 13:30 @81482 回复 ⚑举报　

听雨
游客
@zhudw #81477
运行bookget后又变成这样了，全是json文件，按照提示运行最后的dezoomify-rs.urls则出现这种情况
2023年02月20日 13:44 @81483 回复 ⚑举报　

zhudw
游客
@听雨 #81482
www.shuge.org/meet/topic/80473/
可以参考一下，四川帖一楼有截图说明怎么设置环境变量。也有其他网友给的方法。
2023年02月20日 14:00 @81484 回复 ⚑举报　

Jenkins
游客
请教一下，cookie方式下载是否只适用于国会图书馆、familysearch 家谱网等4个网站？列表没有的图书馆是否不支持的？
2023年02月20日 14:11 @81487 回复 ⚑举报　

zhudw
游客
@Jenkins #81484
只有 US 国会、family 家谱最需要 cookie ，其它的不太需要，用压缩包中的就可以。
列表中没有的，是不支持的。有一种情况除外：如果某网站使用的是 iiif 标准，虽然不在支持列表中，也可以下载。
2023年02月20日 14:15 @81488 回复 ⚑举报　

zhudw
游客
@Jenkins #81484
补充说明：如果某网站的图片文件名是有规律的，0001、0002 这种每页递增，也可以批量下载。详见说明文档。
2023年02月20日 14:35 @81489 回复 ⚑举报　

MEMORY
游客
感谢大神，许久未开电脑上网，新年第一眼看到这个贴，感谢感谢！
2023年02月20日 14:40 @81490 回复 ⚑举报　

听雨
游客
@zhudw #81483
斗胆再问一下，设置了环境变量，下载了十几张图片后又出问题，不知哪里设置不对。
2023年02月20日 14:57 @81493 回复 ⚑举报　

zhudw
游客
@听雨 #81490
有发布说明 github.com/dewei...t/releases
2023年02月20日 15:01 @81494 回复 ⚑举报　

zhudw
游客
@MEMORY #81489
我也是最近几日才上来，祝一切安好。
2023年02月20日 18:30 @81545 回复 ⚑举报　

yngwie
游客
@zhudw #81412
非常感谢！！！
2023年02月20日 19:06 @81547 回复 ⚑举报　

未曾
管理员
@zhudw #81417
感谢~我刚看到，已更新到主帖
2023年02月20日 21:05 @81564 回复 ⚑举报　

轩辕十四
游客
@zhudw #81494
请教先生，book1.3下载资料后如何更改到指定路径文件夹？以及更改图片尺寸大小？
之前一直用这个习惯了，不知能否增加一个类似的参数值设置？
另请教天一阁，键盘Ctrl+C无法复制字体，只能鼠标右键-复制才行。。网上搜寻需要植入代码，小白能力有限，还望先生赐教，感谢！

2023年02月20日 21:28 @81573 回复 ⚑举报　
zhudw
游客
@轩辕十四 #81564
你试试0.2.6版（百度网盘里有旧版）。以下两个参数，可以改存放目录和iiif的图片大小。旧版不会更新了，源码都删除了。请用最新版。
```
SavaPath="D:\downloads"

FullImageWidth = 7000
```
2023年02月20日 21:47 @81575 回复 ⚑举报　

轩辕十四
游客
@zhudw #81573
好的，请问先生怎么将旧版的用在新版1.3里？是将“config.ini”整体放入1.3的文件夹里吗？
2023年02月20日 22:11 @81577 回复 ⚑举报　

zhudw
游客
@轩辕十四 #81575
需要解释一下：
截止今天，最新版是1.0.3（不是1.3版），最后一个使用config.ini的版本是0.2.6。自0.2.7版以后，废弃了config.ini文件，改用命令行参数。不能把旧版的配置文件复制到新版中，不生效的。
上文你提到想解除浏览器右键锁定，可以试一下Edge浏览器扩展 Simple Allow Copy ，这个扩展可以解除大多数网站禁止右键的功能。具体方法你百度一下。

2023年02月20日 22:41 @81578 回复 ⚑举报　

轩辕十四
游客
@zhudw #81577
感谢先生回复，抱歉把版本说错了，是1.0.3。
刚下载天一阁资料，发现有个小问题，就是比如大六壬不分卷
gj.tianyige.com.cn/Searc...a99bd9e100
第11册的图片相邻序号，内容都一样，如第64-65页的2页内容：
或80-82中的3页内容、或有跳页情况（第88张内容是56，下一页就90页57了）：
劳烦先生帮忙看一下，感谢！

2023年02月20日 23:09 @81583 回复 ⚑举报　

zhudw
游客
@轩辕十四 #81578
天一阁存在重复图片，错乱图片。应该是原本如此。需要手动算处理。bookget 暂时无法处理这类问题。
2023年02月20日 23:52 @81591 回复 ⚑举报　

轩辕十四
游客
@zhudw #81583
好的，感谢先生回复！
2023年02月21日 08:41 @81628 回复 ⚑举报　

tigershuai
游客
希望先生写一个该工具常用命令行参数说明，这样使用就更方便了。
2023年02月21日 09:06 @81632 回复 ⚑举报　
zhudw
游客
@tigershuai #81628
常用的不多，github项目主页上有写。
每个人的需求不一样，我下载图书喜欢最大最高清的，不介意浪费硬盘空间和时间。而且喜欢jpg，又不喜欢png；喜欢jp2，又多于喜欢jpg。这其中人看个人的喜好决定怎么使用。
以我为例，最常用的就是：
```
bookget "https://..."        #单图书下载
bookget -i urls.txt          #批量图书下载
bookget -c cookie.txt        #带cookie，自1.0.3起不需要了，默认会带这个
bookget -h                   #查看帮助
```
2023年02月21日 15:37 @81674 回复 ⚑举报　

读者
游客
感谢一把神器
作者
帖子

正在查看 50 个帖子：51-100 (共 2,169 个帖子)

← 1 2 3 … 42 43 44 →

正在查看 50 个帖子：51-100 (共 2,169 个帖子)

← 1 2 3 … 42 43 44 →