标签: 

正在查看 50 个帖子:51-100 (共 2,186 个帖子)
  • 作者
    帖子
  • @81016 回复 ⚑举报 

    zhudw
    游客

    bookget v1.0.2
    [新增] 天一阁博物院古籍数字平台
    [修改] 默认读取bookget本地目录下cookie.txt文件

    提示:

    需要cookie.txt ,压缩包内置有。若不能下载,请手动修改cookie文件。
    可以下载已扫描图像的书籍(包含需要到阅读室,不能下载无图的书籍)。
    如果看到【Please try again later.[401 Unauthorized]】多试一两次就可以。

    @81095 回复 ⚑举报 

    tigershuai
    游客

    又更新了,非常感谢。

    @81104 回复 ⚑举报 

    游客

    @zhudw #81016

    zhudw兄好!天一阁的医书好像都不可以下载的吧?国医典藏现在也都没有完整的医书了么?

    211.102.218.19:7007/search.htm

    @81122 回复 ⚑举报 

    zhudw
    游客

    @光 #81104

    天一阁好像没有公开医类书籍。国医典藏3.0只开放了前30页图像。

    @81127 回复 ⚑举报 

    爱好者
    游客

    请问天一阁的地址是什么?以前的http://www.tianyige.com.cn:8008打不开了

     

    @81133 回复 ⚑举报 

    zhudw
    游客

    @爱好者 #81127

    天一阁博物馆 gj.tianyige.com.cn/

    更多说明文档资料在项目主页 github.com/deweizhu/bookget

    Screenshot_20230218_130625

    @81141 回复 ⚑举报 

    墨雲
    游客

    @zhudw #81122

    有公开医书,但但不多,因为无法进行资源筛选,所以搜索相当困难,只能一页页检查

    @81145 回复 ⚑举报 

    zhudw
    游客

    @墨雲 #81141

    测试搜索【本草】找到书号【善2375】可以下载。如果提示【温馨提示:暂无扫描数据】这种就不能下载了。

    本草綱目五十二卷附圖三卷瀕湖脉學一卷脉訣攷證一卷奇經八脉攷一卷
    https://gj.tianyige.com.cn/SearchPage/0fb94b1bdc0fb86a9c3b4b615116c658

     

    @81160 回复 ⚑举报 

    游客

    @zhudw #81122

    谢谢!可惜了,国医典藏原来那么多经典医书,甘肃图书馆也多,都是不完整的!

    @81167 回复 ⚑举报 

    墨雲
    游客

    @zhudw #81145

    我知道没有数据就无资源,我想说的是必须一个个点进书目信息才能确认有没有资源,相当麻烦,又没有有资源的目录,或者筛选出只显示有资源的书目。

    @81188 回复 ⚑举报 

    wd369
    游客

    @墨雲 #81167

    在查询图书时有json 信息, 从其中的几项数值可以得知是否有扫描。

    @81227 回复 ⚑举报 

    墨雲
    游客

    @zhudw #81145

    对了天一阁下载这个能加多一个图片连接查重吗,因为很多书签的图片是重复的,而图片的实际地址也是一样的,而全部重复的图片都被下载了下来,而图片的实际网址也是一样的,

    @81232 回复 ⚑举报 

    庄子
    游客

    請教一下套書没法设置只下其中某一册是吧?比如这本有20册,点着看了看地址都一样,谢谢!

    gj.tianyige.com.cn/Searc...d185e95a47

    @81241 回复 ⚑举报 

    江山無限
    游客

    @zhudw 请问,如果 天一阁 多册的如果中断下载,可否有简单继续的方法

    @81263 回复 ⚑举报 

    庄子
    游客

    @江山無限 #81241

    重下即可,会跳过已下载的

    @81267 回复 ⚑举报 

    以正
    游客

    不懂就问,dezoomify-rs-zhudw这个软件是干啥用的?

    @81273 回复 ⚑举报 

    墨雲
    游客

    @以正 #81267

    应该就是那个拼图软件的修改版,更适应bookget吧

    @81313 回复 ⚑举报 

    zhudw
    游客

    @庄子 #81232

    我一直也感觉,对于多册书,分册下载是会比较好一些。有时候偷懒,就没去这样写。

    天一阁的下载,增加了一个测试功能,请到百度盘的【测试版】目录去下载。

    使用系统终端运行bookget,只要添加参数 -vol 2,即表示下载第2册。默认不填写,会下载所有册,并且一册一个目录单独存放。

    命令如下:

    .\bookget.exe -vol 2 "https://gj.tianyige.com.cn/SearchPage/aa13185a8fc77c6e186eccd185e95a47"
    @81315 回复 ⚑举报 

    zhudw
    游客

    @以正 #81267

    1.0.2发布说明有写,专门下载四川、云南图书馆用的dezoomify-rs修改版。

    @墨雲 #81227

    天一阁的图片,是存在多页图片相同。暂时没有硬件条件去处理这个问题。解决方法会导致编译跨平台版本困难(需同时有三种系统,至少一台Mac,一台Windows或Linux计算机)。

    @81321 回复 ⚑举报 

    庄子
    游客

    @zhudw #81313

    有勞您修改完善了,主要是有些大套書相互間關係并不大,只需要其中小部分,非常感謝!

    @81340 回复 ⚑举报 

    最初
    游客

    啥命令可以几本书一起下载

    @81342 回复 ⚑举报 

    zhudw
    游客

    @最初 #81340

    批量下载多个URL。在终端内输入以下命令:
      bookget -i urls.txt

    提示:urls.txt可以是任意文件名,内容是要下载的图书URL,一行一个URL,回车换行。

    @81372 回复 ⚑举报 

    yngwie
    游客

    @zhudw #81342

    不知道zhudw老师是否可考虑在软件中,加入「江苏省珍贵古籍数字资源集成平台」(http://218.2.105.121/#/library)下载?感谢!受惠软件及平台甚多,借此致上谢意。

    @81412 回复 ⚑举报 

    zhudw
    游客

    @yngwie #81372

    江苏和云南、四川都是同一个软件系统。略作修改,已经支持了。请下载最新的1.0.3版试一下。

    江苏古籍服务器限制并发连接数较严格,即使单线程下载,也会在N秒以后限制访问。届时,将无法打开该网站。更换IP后,可继续下载。

    @81417 回复 ⚑举报 

    zhudw
    游客

    @未曾先生,如果看到。请帮忙更新一下,一楼的原帖。谢谢!

    项目主页:http://github.com/deweizhu/bookget

    此工具用于下载数字化古籍图书,目前支持约30~40个图书馆。

    采用GPL-3.0开源协议,欢迎有开发能力的朋友二次修改、分发(前提是你遵守了GPL-3.0 license)。

    最新下載地址:
    github:https://github.com/deweizhu/bookget/releases
    百度盘:https://pan.baidu.com/s/1RGvNEp3gDqB4z_r3SGwKmw?pwd=55uk
    一般同步更新,推荐从github下载,它包含源代码、及说明文档。

    更新日志
    bookget v1.0.3
    [新增]江苏珍贵古籍数字平台
    [修复]柏林国立图书馆,多册分目录存放
    [修复]天一阁用户鉴权,理论上不会再出现401错误

    bookget v1.0.2
    [新增] 天一阁博物院古籍数字平台
    [修改] 默认读取bookget本地目录下cookie.txt文件

    bookget v1.0.1
    [新增]四川数字古籍图书馆
    [新增]云南数字古籍图书馆

    提示:
    1、四川、云南、江苏古籍数字平台,需要使用 dezoomify-rs-zhudw 修改版。(无需单独下载,最新版已包含)
    2、使用前,请先阅读项目主页上的说明文档。

    @81472 回复 ⚑举报 

    道统
    游客

    你好 我想请问下 下载好了的文件名是需要手工重新命名的吗 想知道是不是自己弄错了

    TUB50L`7%%AO1UYMJH@0){M

    @81476 回复 ⚑举报 

    听雨
    游客

    QQ截图20230220131647

    请教大神,下载江苏省珍贵古籍数字资源集成平台的书出现这种情况怎么处理?

    @81477 回复 ⚑举报 

    zhudw
    游客

    @道统 #81472

    下载后的文件名 00 需要手动修改。

    @听雨 #81476

    运行 bookget ,你打开错软件了

    @81479 回复 ⚑举报 

    道统
    游客

    @zhudw #81477

    谢谢 十分感谢 国图下载中

    @81482 回复 ⚑举报 

    听雨
    游客

    @zhudw #81477

    QQ截图20230220132444

    运行bookget后又变成这样了,全是json文件,按照提示运行最后的dezoomify-rs.urls则出现这种情况

    QQ截图20230220132958

    @81483 回复 ⚑举报 

    zhudw
    游客

    @听雨 #81482

    www.shuge.org/meet/topic/80473/

    可以参考一下,四川帖一楼有截图说明怎么设置环境变量。也有其他网友给的方法。

    @81484 回复 ⚑举报 

    Jenkins
    游客

    请教一下,cookie方式下载是否只适用于国会图书馆、familysearch 家谱网等4个网站?列表没有的图书馆是否不支持的?

    @81487 回复 ⚑举报 

    zhudw
    游客

    @Jenkins #81484

    只有 US 国会、family 家谱最需要 cookie ,其它的不太需要,用压缩包中的就可以。

    列表中没有的,是不支持的。有一种情况除外:如果某网站使用的是 iiif 标准,虽然不在支持列表中,也可以下载。

    @81488 回复 ⚑举报 

    zhudw
    游客

    @Jenkins #81484

    补充说明:如果某网站的图片文件名是有规律的,0001、0002 这种每页递增,也可以批量下载。详见说明文档。

    @81489 回复 ⚑举报 

    MEMORY
    游客

    感谢大神,许久未开电脑上网,新年第一眼看到这个贴,感谢感谢!

    @81490 回复 ⚑举报 

    听雨
    游客

    @zhudw #81483

    斗胆再问一下,设置了环境变量,下载了十几张图片后又出问题,不知哪里设置不对。QQ截图20230220143754

    @81493 回复 ⚑举报 

    zhudw
    游客

    @听雨 #81490

    有发布说明 github.com/dewei...t/releases

    Screenshot_20230220_145609

    @81494 回复 ⚑举报 

    zhudw
    游客

    @MEMORY #81489

    我也是最近几日才上来,祝一切安好。

    @81545 回复 ⚑举报 

    yngwie
    游客

    @zhudw #81412

    非常感谢!!!

    @81547 回复 ⚑举报 

    未曾
    管理员

    @zhudw #81417

    感谢~我刚看到,已更新到主帖

    @81564 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #81494

    请教先生,book1.3下载资料后如何更改到指定路径文件夹?以及更改图片尺寸大小?

    之前一直用这个习惯了,不知能否增加一个类似的参数值设置?

    1

    另请教天一阁,键盘Ctrl+C无法复制字体,只能鼠标右键-复制才行。。网上搜寻需要植入代码,小白能力有限, 还望先生赐教,感谢!

     

    @81573 回复 ⚑举报 

    zhudw
    游客

    @轩辕十四 #81564

    你试试0.2.6版(百度网盘里有旧版)。以下两个参数,可以改存放目录和iiif的图片大小。旧版不会更新了,源码都删除了。请用最新版。

    SavaPath="D:\downloads"
    
    FullImageWidth = 7000

     

    @81575 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #81573

    好的,请问先生怎么将旧版的用在新版1.3里?是将“config.ini”整体放入1.3的文件夹里吗?

    @81577 回复 ⚑举报 

    zhudw
    游客

    @轩辕十四 #81575

    需要解释一下:

    截止今天,最新版是1.0.3(不是1.3版),最后一个使用config.ini的版本是0.2.6。自0.2.7版以后,废弃了config.ini文件,改用命令行参数。不能把旧版的配置文件复制到新版中,不生效的。

    上文你提到想解除浏览器右键锁定,可以试一下Edge浏览器扩展 Simple Allow Copy ,这个扩展可以解除大多数网站禁止右键的功能。具体方法你百度一下。

     

     

    @81578 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #81577

    感谢先生回复,抱歉把版本说错了,是1.0.3。

    刚下载天一阁资料,发现有个小问题,就是比如大六壬不分卷

    gj.tianyige.com.cn/Searc...a99bd9e100

    第11册的图片相邻序号,内容都一样,如第64-65页的2页内容:

    1

    或80-82中的3页内容、或有跳页情况(第88张内容是56,下一页就90页57了):

    13

    劳烦先生帮忙看一下,感谢!

     

    @81583 回复 ⚑举报 

    zhudw
    游客

    @轩辕十四 #81578

    天一阁存在重复图片,错乱图片。应该是原本如此。需要手动算处理。bookget 暂时无法处理这类问题。

    @81591 回复 ⚑举报 

    轩辕十四
    游客

    @zhudw #81583

    好的,感谢先生回复!

    @81628 回复 ⚑举报 

    tigershuai
    游客

    希望先生写一个该工具常用命令行参数说明,这样使用就更方便了。

    @81632 回复 ⚑举报 

    zhudw
    游客

    @tigershuai #81628

    常用的不多,github项目主页上有写。

    每个人的需求不一样,我下载图书喜欢最大最高清的,不介意浪费硬盘空间和时间。而且喜欢jpg,又不喜欢png;喜欢jp2,又多于喜欢jpg。这其中人看个人的喜好决定怎么使用。

    以我为例,最常用的就是:

    bookget "https://..."        #单图书下载
    bookget -i urls.txt          #批量图书下载
    bookget -c cookie.txt        #带cookie,自1.0.3起不需要了,默认会带这个
    bookget -h                   #查看帮助
    @81674 回复 ⚑举报 

    读者
    游客

    感谢一把 神器

正在查看 50 个帖子:51-100 (共 2,186 个帖子)
正在查看 50 个帖子:51-100 (共 2,186 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:bookget 开源了(更新至:24.0923)
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。