[洽特] 用Calibre抓取本本在E變態資訊

看板 AC_In
作者 jansuijsl (昂昂)
時間 2019-07-27 04:27:46
留言 14則留言 (6推 0噓 8→)

前言 7/15看到 [洽特] 能不能自動化管理本本? 後好奇去找相關的處理軟體,發現calibre 可 以抓取E & EX 資訊 本來是希望熟悉後再寫教學,直到7/26看到EX變態關閉... 1. 安裝 calibre (建議使用免安裝版, 並將程式放在dropbox,google sync 中) 2. 設定書庫位置,所有書會被複製放在此處 注意大部分設定存在相關書庫位置中,先切換/建立書庫後再往下做 匯入書本會被變更以英文命名,以及轉檔成CBZ/CBR,後面會提到不轉檔的辦法 書庫會產生metadata.db, 可以用DB brower 開啟 https://imgur.com/y2RkREE 3. 偏好設定-->匯入/匯出--> 加入書本-->讀取詮釋資料 勾選 從檔案內容而不是檔案名稱讀取詮釋資料 正規表達式內容如下,目前我只有做單行本的彙整,以下是我目前使用的規則, 主要以 作 者,書名為主 comments 為測試讀取同人誌 Cxx 用, 如果有更好的設定方式歡迎提出 變更正則設定: By HeyDrunk (\((?P<comments>.+?)\))?\s?\[(?P<author>.+?)\]{1}(?P<title>.+) https://imgur.com/Q0FB7GJ 4. 偏好設定-->匯入/匯出--> 加入書本-->加入動作 勾選 標記新加入的書本 其餘的選項可以不選 https://imgur.com/Q0FB7GJ 5. 偏好設定-->匯入/匯出--> 將書本儲存至磁碟 將非英語字元轉換為英語同義字 取消勾選 設定匯出的文件名稱格式 [{authors}]{title} https://imgur.com/ss5AtGm 6. 偏好設定-->介面-->外觀 6.1 可以設定語言 如果開啟是英文的可以在此改成中文 6.2 標籤瀏覽器--> 有階層項目的分類-->輸入 tags 重啟calibre https://imgur.com/A2g5TFy 7. 如果不希望Calibre 匯入時將檔案轉成CBZ/CBR 可以停用外掛中Archive Extract 的 外掛,或是在檔案中放入jpg, png 以外的檔案 如:.txt, .html 缺點是Calibre 不會在匯入書本同時抓取封面 P.S 封面可以ctrl+c 複製任一圖片後 在原封面上右鍵貼上 以上是使用前基本的前置作業, 再來是如何將資料從E變態抓取下來 下載metadata,安裝方式可以參考作者的網站,因為原作者將misc 部分tag 刪除,需要修改 部分程式碼 https://github.com/yingziwu/doujinshi_metadata_plugins/blob/master/ehentai_metadata/README_cn.md 用Notepad 開啟__init__.py 並修改第70行 log('misc tag %s' % tag) tag = 'misc:' + tag tags_.append(tag) 放上我修改後的檔案版本v1.1.3,新增一行指令並分享我修改的的插件, 看起來misc: 還是有些問題, 我對於python 完全不瞭解.. 如果有人知道如何改比較好,歡迎提出 https://mega.nz/#!h5tBkaZA!iyv-WeoxW9_5VDruLoT9hdrvyZqYZDh_HSKS6--nBn0 2019/8/5 v1.1.3.1 修改部分正則設定,不移除熊貓上 title (原作名稱) https://mega.nz/#!goNXWYqR!S55FV8lED0RtgIVRPJaPUjMwWzsfZ4aeEjrfYgICAYU 8. 偏好設定--> 外掛-->從檔案載入外掛, 安裝後自動重啟calibre 9. 偏好設定-->詮釋資料下載--> 勾選 E-hentai Galleries 其餘可以不用 9.1 configure select source --> 下載資料 出版社/標籤/評分 都要勾選 Use exhentai 已無法使用不要勾選.. 9.2 Max number of tags to download: 99 https://imgur.com/F4NHM9Q 10. 因為 E & EX tag 用: 做分類而Calibre 用. 做分類 需要修改此部分設定, 舉例來 說 偏好設定-->詮釋資料下載 edittag mapper rules -->新增規則 "取代" 標籤,如果它"符合模式": "female:" with the tag: "01_女性." "取代" 標籤,如果它"符合模式": "male:" with the tag: "02_男性." "取代" 標籤,如果它"符合模式": "artist:" with the tag: "03_作者." "取代" 標籤,如果它"符合模式": "group:" with the tag: "04_社團." "取代" 標籤,如果它"符合模式": "misc:" with the tag: "99_雜項." 設定完後可以按儲存, 檔案放在Calibre Portable\Calibre Settings\tag-map-rules.json 11. 以上是所有設定的基本內容,設定完畢可以將檔案用拖曳的方式將zip 放入Calibre 中, 如果加入書本正規表達式符合會抓到檔案名稱中的 作者與 書名 12. 選取檔案後右鍵 編輯詮釋資料--> 下載詮釋資料與封面(ctrl+D) 下載詮釋資料 如果有E變態 上有符合作者/書名會抓到的相關tag& 評分,如果是同人誌 Cxx 放在出版社 欄位中 如果沒有資料會出現錯誤 P.S: 部分的書無法抓到正確的資料, 會抓到錯誤的資訊並修改書名, 但是大約7成 書名 與作者正確的書如果E變態有資料可以正確識別 P.S2: 注意同一時間下載資料數量過多一樣會被BAN P.S3: 因為EX 已經關閉,部分書籍沒有資料是正常的, P.S4: 系列書籍 如:シャイニング娘1~6 因為E-hentai Galleries 詮釋資料下載程式問 題只能取得其中一本書的tag,其餘的書標題也會被換掉 要注意改回來,或是手動新增tag 附上這幾天整理的成果,有標籤與評分的表示抓取成功 https://imgur.com/ErcI6Gh --
※ 批踢踢實業坊(ptt.cc), 來自: 114.45.145.251 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1564172869.A.B69.html

zzz54666: 不死熊貓 07/27 09:18

HeyDrunk: 檔名用正則抓作者、書名和場次的部分,好像少了個問號 07/27 11:52

HeyDrunk: (\((?P<comments>.+?)\))?\s?\ 07/27 11:53

HeyDrunk: https://imgur.com/CM2WB8Y 07/27 11:58

HeyDrunk: https://imgur.com/RrCHqFc 07/27 11:59

kevin552216: 這邊分享我重新壓縮的腳本好了,這電子書程式只吃壓 07/28 21:13

kevin552216: 縮,https://github.com/kevin552216/rezip_ps 07/28 21:14

HeyDrunk: EX 的Tag 都載不了,不知道板上度Local Panda 能不能搭 07/31 21:32

HeyDrunk: 配使用…… 但是不清楚Calibre 的插件怎麼寫,DB 也還要 07/31 21:32

HeyDrunk: 再複習一下 07/31 21:32

titain: EX熊貓已可正常查詢 08/20 23:13

titain: 踩到bug,存檔一定要用cbz格式,用其他的會無法轉換格式 08/31 21:35

titain: www.mobileread.com/forums/showthread.php?t=79785 08/31 21:36

titain: 2010年就有人踩到,到現在還沒修掉 08/31 21:36

您可能感興趣