[雜談] 受夠了廣告與分利機制!從 Pixnet 痞客邦搬家到 Blogger 的自動化血淚實錄 (Python + HTTrack 終極應用)
這篇筆記記錄了我如何受夠了 Pixnet 的蓋板廣告,利用 Python 與 HTTrack 將 90 多篇技術文章自動化搬家到 Blogger 的血淚史。內含詳細的腳本邏輯解決圖片防盜連、ID 衝突與 HTML 清洗教學,並分享 V61 PRO 排版系統的設計思路。
📝 寫在前面:其實我是一個懶得寫 Blog 的人。那為什麼還要寫,因為有一天我可能會失憶。
終於!經過了長達數週的奮戰,我成功把 Pixnet 上那九十幾篇技術筆記,連同數千張截圖,完美地搬到了 Google Blogger!這篇不是教學,更像是一篇 血淚史 和 工程師的抱怨文。如果你也受夠了舊平台的廣告和資料綁架,這篇你非看不可!
終於!經過了長達數週的奮戰,我成功把 Pixnet 上那九十幾篇技術筆記,連同數千張截圖,完美地搬到了 Google Blogger!這篇不是教學,更像是一篇 血淚史 和 工程師的抱怨文。如果你也受夠了舊平台的廣告和資料綁架,這篇你非看不可!
第一階段:為什麼我對 Pixnet 徹底心寒?(滿版廣告的末日)
我在 Pixnet 寫網管筆記也很多年了,累積的內容也算豐富。但最近這幾年的使用者體驗真的只能用「忍耐」來形容。這不是一篇普通的文章,這是一篇對 [Pixnet 廣告蓋板地獄] 的公開宣戰!
⚠️ 壓倒駱駝的三根稻草:
- 廣告蓋板地獄:手機版一點開,蓋板廣告先蓋滿螢幕。我自己要找指令都要先經歷三層考驗,這對 SEO 根本是自殺行為。
- 資料綁架的恐懼:Pixnet 備份 XML 裡的圖片連結都是鎖住的,有防盜連(Hotlink Protection)。一旦離開平台,圖片全部變叉燒包。身為網管,我不接受資料主控權不在自己手上。
- 排版髒亂不堪:後台編輯器產生的代碼一團糟,充滿了各種行內樣式,貼個乾淨的 Code 進去,出來的 HTML 比病毒還可怕。
我的結論: 長痛不如短痛,再見了,痞客邦! Blogger 雖然簡樸,但它乾淨、穩定、ID 是自己的,這才是寫技術文章的淨土!
第二階段:工程師的野蠻備份法 (HTTrack 終極應用)
Blogger 官方的匯入功能只會搬文字!手動下載圖片的時間成本太高,我寧可寫 Code。我們必須使用硬核工具達成「全站鏡像」。
1. 祭出老牌神器:HTTrack 吸星大法
我使用了 HTTrack Website Copier 將全站圖片打包存到硬碟 (D:\pixnet)。這就是後續 Python 程式碼能找到圖片的「圖片倉庫」。
2. 關鍵 Project 設定:確保圖片不遺漏
在 Project Setup 中,務必設定好儲存路徑,這將作為我們處理的基底路徑。
重點設定:如何抓到 pimg.tw 的圖片 (Scan Rules)
必須加入以下規則,否則抓不到實體圖床連結:
+*.pixnet.net/*
+*.pixnet.net/*/*
+https://sungshu.pixnet.net/*
+https://sungshu.pixnet.net/*/*
+*.jpg +*.png +*.gif +*.jpeg +*.svg +*.webp
+*.pixnet.net/*/*
+https://sungshu.pixnet.net/*
+https://sungshu.pixnet.net/*/*
+*.jpg +*.png +*.gif +*.jpeg +*.svg +*.webp
第三階段:Python 全自動化流水線 (V1-V52 血戰史)
中間的鴻溝,只能靠 Python 程式碼 (process_blog_migration.py) 來填補,這背後是無數次的修正與嘗試。
1. 核心突破:圖片歸檔與 ID 重構 (V44 關鍵戰役)
- 圖片重編號:程式自動比對 XML 連結,更名為
01.jpg,02.jpg分類存放。 - 解決 ID 衝突 (V44 核心):Blogger 匯入若發現 ID 重複會直接跳過。腳本強制將 ID 替換為 時間戳 + 亂數,確保所有文章 100% 被匯入。
第四階段:最終成果
⚡ 最終發文 SOP 簡化到極致
MIGRATION WORKFLOW
01
匯入 XML 檔 (blogger_import_v52_final.xml),全部文章瞬間上架。
02
打開文章,複製 HTML Header 註解 裡的標籤,貼到 Blogger 標籤欄。
03
在 Blogger 編輯器裡,對著圖片佔位符,從電腦資料夾裡拖曳圖片進去取代。
04
發布!收工!原本一整月的工程,現在幾天內就搞定了。
💡 總結心得:
這次搬家過程雖然一波三折,但也讓我再次深刻體會到「自動化」的美好。雖然撰寫腳本花了不少時間(還跟 AI 吵架了好幾次 XD,一路從 V17 調整到最終 V52),但這一切努力證明了技術永遠是最佳手段。
這次搬家過程雖然一波三折,但也讓我再次深刻體會到「自動化」的美好。雖然撰寫腳本花了不少時間(還跟 AI 吵架了好幾次 XD,一路從 V17 調整到最終 V52),但這一切努力證明了技術永遠是最佳手段。
- 資料主控權:圖片都在我硬碟和 Google 相簿裡,不再受制於 Pixnet。
- 版面乾淨:沒有蓋板廣告,讀者閱讀體驗大幅提升。
- SEO 優化:透過程式自動生成的標籤,新站架構比舊站更嚴謹。
留言
張貼留言