小文件拷貝
我們使用 NodeJS 內置的 fs 模塊簡單實現這個程序如下。
以上程序使用 fs.readFileSync 從源路徑讀取文件內容,并使用 fs.writeFileSync 將文件內容寫入目標路徑。
豆知識: process 是一個全局變量,可通過 process.argv 獲得命令行參數。由于 argv[0] 固定等于 NodeJS 執行程序的絕對路徑,argv[1] 固定等于主模塊的絕對路徑,因此第一個命令行參數從 argv[2] 這個位置開始。
大文件拷貝
上邊的程序拷貝一些小文件沒啥問題,但這種一次性把所有文件內容都讀取到內存中后再一次性寫入磁盤的方式不適合拷貝大文件,內存會爆倉。對于大文件,我們只能讀一點寫一點,直到完成拷貝。因此上邊的程序需要改造如下。
以上程序使用 fs.createReadStream 創建了一個源文件的只讀數據流,并使用 fs.createWriteStream 創建了一個目標文件的只寫數據流,并且用 pipe 方法把兩個數據流連接了起來。連接起來后發生的事情,說得抽象點的話,水順著水管從一個桶流到了另一個桶。
遍歷目錄
遍歷目錄是操作文件時的一個常見需求。比如寫一個程序,需要找到并處理指定目錄下的所有JS文件時,就需要遍歷整個目錄。
遞歸算法
遍歷目錄時一般使用遞歸算法,否則就難以編寫出簡潔的代碼。遞歸算法與數學歸納法類似,通過不斷縮小問題的規模來解決問題。以下示例說明了這種方法。
上邊的函數用于計算 N 的階乘(N!)。可以看到,當 N 大于 1 時,問題簡化為計算 N 乘以 N-1 的階乘。當 N 等于 1 時,問題達到最小規模,不需要再簡化,因此直接返回 1。
陷阱: 使用遞歸算法編寫的代碼雖然簡潔,但由于每遞歸一次就產生一次函數調用,在需要優先考慮性能時,需要把遞歸算法轉換為循環算法,以減少函數調用次數。
遍歷算法
目錄是一個樹狀結構,在遍歷時一般使用深度優先+先序遍歷算法。深度優先,意味著到達一個節點后,首先接著遍歷子節點而不是鄰居節點。先序遍歷,意味著首次到達了某節點就算遍歷完成,而不是最后一次返回某節點才算數。因此使用這種遍歷方式時,下邊這棵樹的遍歷順序是 A > B > D > E > C > F。
A / \ B C / \ \ D E F
同步遍歷
了解了必要的算法后,我們可以簡單地實現以下目錄遍歷函數。
可以看到,該函數以某個目錄作為遍歷的起點。遇到一個子目錄時,就先接著遍歷子目錄。遇到一個文件時,就把文件的絕對路徑傳給回調函數。回調函數拿到文件路徑后,就可以做各種判斷和處理。因此假設有以下目錄:
- /home/user/ - foo/ x.js - bar/ y.js z.css
使用以下代碼遍歷該目錄時,得到的輸入如下。
/home/user/foo/x.js /home/user/bar/y.js /home/user/z.css
異步遍歷
如果讀取目錄或讀取文件狀態時使用的是異步API,目錄遍歷函數實現起來會有些復雜,但原理完全相同。travel函數的異步版本如下。
這里不詳細介紹異步遍歷函數的編寫技巧,在后續章節中會詳細介紹這個。總之我們可以看到異步編程還是蠻復雜的。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com