search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

通過Python實現自動填寫調查問卷

*本文原創作者Mochazz,屬於FreeBuf原創獎勵計劃,禁止轉載

0X00 前言

快開學了,看到空間裡面各種求填寫調查問卷的,我才想起來貌似我也還沒做。對於這種無意義的問卷,我是不怎麼感冒的,所以我打算使用」特技」來完成,也就是python,順便重新複習一下python,真的好久沒用了。下面,表演開始……

0X01代碼編寫思路

首先先創建一份問卷

我們隨便填寫一個問卷並提交,在提交之前開啟Burpsuite截獲數據包

對於截獲的數據包進行分析,有的被url編碼了不利於分析,可以使用Burpsuite編碼模塊解碼替換,這樣就好分析了

通過觀察可以發現,post了一串奇怪的數據submitdata=1$2}2$3}3$3}4$4}5$3}6$2}7$4}8$2}9$3}10$3。仔細分析可看出數據大概是這個意思submitdata=題號$選項號}題號$選項號}題號$選項號}……..

利用這些信息就可以開始編寫python程序了

運行結果如下

貌似網站還有其他反爬蟲機制,在連續提交幾個表單之後,就出現了驗證碼。難道此時我們還要給程序添加上識別驗證碼的功能?其實不必,我們可以先分析一下剛剛Burpsuite截獲的header信息,來看看到底網站是通過什麼方式,識別出我們是用爬蟲來提交問卷的。

通過一番測試,我發現當我連續提交3份問卷,再換一個IP提交3個問卷,也就是連續提交了6份問卷,並沒有觸髮網站的反爬蟲機制。所以我們可以猜測對方基於IP提交問卷的頻率來識別爬蟲程序的。看到這裡,大家可能會想,我們可以通過網上的免費代理來提交問卷。例如這些

那是不是意味著我們還要往python代碼中添加提取免費代理IP的功能呢?NO NO NO!換個思路,在CTF比賽中會遇到一種題目,例如你的IP是來自德國的才可以拿到flag。所以,我們的思路就是進行數據包頭欺騙,偽造我們的IP,騙過伺服器。下面來說說偽造IP的幾種方式。

X-Client-IP:1.1.1.1

X-Remote-IP:2.2.2.2

X-Remote-Addr:3.3.3.3

X-Originating-IP:4.4.4.4

X-Forwarded-For:5.5.5.5

我們每個都嘗試一下,然後在後台統計那裡可以看到我們的問捲來源

這裡我們發現用X-Forwarded-For可以繞過,按我們就用這種方法在header信息中添加X-Forwarded-For欄位,所以修改後的腳本如下

運行結果如下

再到後台看看統計信息

至此,我們算是完美的解決任務了。如果大家想去掉調查問卷外的IP地址,可以收集一下的IP地址段,然後添加進程序,處理一下即可。

0X02總結

大家平常可以把學到的東西用到實際生活中,遇到困難的時候不要慌,多思考,找到最優的解決方法。例如上面,我並沒有在代碼中添加驗證碼識別模塊,也沒有通過走代理的方式來繞過網站的反爬蟲機制,而是通過分析網站的反爬蟲機制,並且使用所學的安全知識(HTTP頭欺騙)輕鬆解決問題,使用最短的代碼完美完成任務。

PS:如果有什麼更好的欺騙方法,歡迎交流,也歡迎來訪問我的個人blog:



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦