最近一個工作需求是要爬近 TB 等級的資料,資料的儲存格式是散落在各資料夾中的 XML 檔。然而實際爬蟲發現 IO 的瓶頸反而不是處理 XML 檔及萃取資料並寫入資料庫中,瓶頸是出現在走訪資料夾所花費的時間。原本想改用 Multi Thread / Process 的方式處理,無奈自己也不太熟悉。最後則是改採 glob 模組,讓搜尋資料夾中 XML 檔的效率增加,整體的作業時間就有相當明顯的改善!

雙螢幕帶來了許多方便,但不是每個應用情境都需要使用雙螢幕。而如果要暫時關閉第二個螢幕,特地拔除硬體線路又太過大費周章,最簡便的方式就是藉由軟體來控制。
微軟調整了課程與認證的產品線,聚焦在 Role-Based 類型的認證 ,初級的認證則保留了 MTA。但過往的認證課程仍有許多參考的價值,尤其是課程的教材、課程的大綱與核心目標,故特別筆記相關清單。