国产99久久精品_欧美日本韩国一区二区_激情小说综合网_欧美一级二级视频_午夜av电影_日本久久精品视频

最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當(dāng)前位置: 首頁 - 科技 - 知識百科 - 正文

python爬蟲怎么識別

來源:懂視網(wǎng) 責(zé)編:小采 時間:2020-11-27 14:09:53
文檔

python爬蟲怎么識別

python爬蟲怎么識別:1、輸入式驗(yàn)證碼這種驗(yàn)證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進(jìn)行驗(yàn)證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術(shù)叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
推薦度:
導(dǎo)讀python爬蟲怎么識別:1、輸入式驗(yàn)證碼這種驗(yàn)證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進(jìn)行驗(yàn)證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術(shù)叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背

1、輸入式驗(yàn)證碼

這種驗(yàn)證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進(jìn)行驗(yàn)證。如下圖

2b08202427ba636761493ee4d452b3a.png

解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術(shù)叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背影影響的驗(yàn)證碼如圖2,直接通過這個庫來識別就可以。但是對于有嘈雜的背景的驗(yàn)證碼這種,直接識別識別率會很低,遇到這種我們就得需要先處理一下圖片,先對圖片進(jìn)行灰度化,然后再進(jìn)行二值化,再去識別,這樣識別率會大大提高。

2.滑動式驗(yàn)證碼

475cc25edfb6818a2f24321e7f7f63d.png

解決思路:對于這種驗(yàn)證碼就比較復(fù)雜一點(diǎn),但也是有相應(yīng)的辦法。我們直接想到的就是模擬人去拖動驗(yàn)證碼的行為,點(diǎn)擊按鈕,然后看到了缺口的位置,最后把拼圖拖到缺口位置處完成驗(yàn)證。

第一步:點(diǎn)擊按鈕。然后我們發(fā)現(xiàn),在你沒有點(diǎn)擊按鈕的時候那個缺口和拼圖是沒有出現(xiàn)的,點(diǎn)擊后才出現(xiàn),這為我們找到缺口的位置提供了靈感。

第二步:拖到缺口位置。我們知道拼圖應(yīng)該拖到缺口處,但是這個距離如果用數(shù)值來表示?通過我們第一步觀察到的現(xiàn)象,我們可以找到缺口的位置。這里我們可以比較兩張圖的像素,設(shè)置一個基準(zhǔn)值,如果某個位置的差值超過了基準(zhǔn)值,那我們就找到了這兩張圖片不一樣的位置,當(dāng)然我們是從那塊拼圖的右側(cè)開始并且從左到右,找到第一個不一樣的位置時就結(jié)束,這是的位置應(yīng)該是缺口的left,所以我們使用selenium拖到這個位置即可。這里還有個疑問就是如何能自動的保存這兩張圖?這里我們可以先找到這個標(biāo)簽,然后獲取它的location和size,然后 top,bottom,left,right = location['y'] ,location['y']+size['height']+ location['x'] + size['width'] ,然后截圖,最后摳圖填入這四個位置就行。具體的使用可以查看selenium文檔,點(diǎn)擊按鈕前摳張圖,點(diǎn)擊后再摳張圖。最后拖動的時候要需要模擬人的行為,先加速然后減速。因?yàn)檫@種驗(yàn)證碼有行為特征檢測,人是不可能做到一直勻速的,否則它就判定為是機(jī)器在拖動,這樣就無法通過驗(yàn)證了。

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

python爬蟲怎么識別

python爬蟲怎么識別:1、輸入式驗(yàn)證碼這種驗(yàn)證碼主要是通過用戶輸入圖片中的字母、數(shù)字、漢字等進(jìn)行驗(yàn)證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內(nèi)容,然后填入到輸入框中即可。這種識別技術(shù)叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
推薦度:
標(biāo)簽: 如何 識別 如何識別
  • 熱門焦點(diǎn)

最新推薦

猜你喜歡

熱門推薦

專題
Top
主站蜘蛛池模板: 色就是色欧美色图 | 精品国产一区二区三区免费看 | 日本黄a| 国产一在线 | 国产精品视频免费 | 国产精品电影一区二区 | 激情欧美一区二区三区中文字幕 | 欧美日韩国产一区二区 | 亚洲国产精久久久久久久 | 欧美一区二区免费 | 国内一级野外a一级毛片 | 欧美色图网站 | 欧美高清视频一区 | 欧美日视频 | 欧美日韩亚洲无线码在线观看 | 欧美无极品 | 久久精品无遮挡一级毛片 | 久久久久久久久久久9精品视频 | 久久精品a亚洲国产v高清不卡 | 美女视频黄全免费的 | 久久国产精品一区二区三区 | 国产在线播放一区 | 伊人久久综合网亚洲 | 黄色毛片在线观看 | 亚洲色图 第一页 | 久久久久女人精品毛片九一 | 欧美一区二区三区四区视频 | 欧美国产综合在线 | 天天曰夜夜曰 | 中文国产成人精品久久一 | 91精品一区二区三区在线 | 亚洲国产精品婷婷久久 | 亚洲精品日韩中文字幕久久久 | 二区久久国产乱子伦免费精品 | 欧美成人精品高清在线播放 | 亚洲第一页中文字幕 | 国产精品va在线观看无 | 亚洲欧美日韩天堂 | 国产精品乱码一区二区三区 | 一区二区三区亚洲 | 丝袜视频一区 |