從 0 開始制作一個 NodeJS 命令行驗證碼識別工具。實現如下效果。
初始化項目
# 創建 recognition 項目 mkdir recognition cd recognition npm init -y # 安裝主依賴 yarn add images tesseract.js # 安裝工具依賴 yarn add chalk yargs # 可選依賴 yarn add socks5-http-client
依賴說明
images :Node.js 輕量級跨平臺圖像編碼庫,用于處理下載下來的圖片
tesseract.js :純 JS 實現的 OCR(光學字符識別)工具,用于圖像內容識別
chalk :讓命令行內容樣式好看
yargs :命令行參數解析器
socks5-http-client :SOCKS v5,用于設置代理,在需要拉取某些不能直接訪問的資源時使用, request proxy 例子
項目準備
新建 cli.js
通常命令行工具入口名字為 cli.js
,我們新建一個 cli.js
文件,并在開頭寫上:
#!/usr/bin/env node
這樣,我們告訴 *nix 系統,JavaScript 文件的解釋器應該是 /usr/bin/env node
,它查找本地安裝的 node
。
配置 bin
// package.json { "bin": { "reg": "./cli.js" } }
這樣配置完成后,別人 npm install -g @chenng/recognition
的包,就可以直接通過命令行運行了:
reg --url=https://static.chenng.cn/imgs/test_img.png
link 本地開發
我們如何能夠在本地可以使用 rec
命令呢?只需要把本項目 link 即可:
yarn link
核心邏輯
主要邏輯在 cli.js
和 recognize.js
中。這里有幾個注意點:
encoding: null
,否則返回的是亂碼const Tesseract = require('tesseract.js'); const images = require('images'); const requset = require('request'); const fs = require('fs'); const { promisify } = require('util'); const chalk = require('chalk'); const writeFile = promisify(fs.writeFile); const rp = promisify(requset); class Recognize { constructor(url) { Recognize.downloadDir = `${__dirname}/dist/`; Recognize.downloadFile = `${__dirname}/dist/temp.png`; this.url = url; this.start(); } async start() { const data = await this.downloadImg(); await writeFile(Recognize.downloadFile, data); this.recognize(); const result = await Tesseract.recognize(Recognize.downloadFile, { lang: 'eng', tessedit_char_blacklist: 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ', }); console.log(` 識別成功! 識別
具體可以查看源碼倉庫: https://github.com/ringcrl/recognition
發布上線
# 新建代碼倉庫,git push # 登錄到 npm npm adduser # 發包 npm publish --access public # 全局安裝 npm install -g @chenng/recognition
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com