Octoparse
在將代理集成到Octoparse之前,請確保您已經正確設置代理,以保障代理服務能夠正常運行。
1.打開Octoparse應用程序。
2.在左上角菜單中,將滑鼠懸停在新建按鈕上,然後單擊高級模式。出於測試目的,我們將創建一個自定義任務。
3.在網站字段中,指定要從中提取數據的網站。然後單擊保存按鈕。
4.您現在應該位於“任務”選項卡中。要配置我們的代理,請選擇“設置”按鈕。
5.在彈出菜單中,向下滑動到防阻止設置並選中使用 IP 代理選項。現在您應該可以單擊“設置”按鈕。
6.在代理設置彈出窗口中,定義要使用的代理。由於Octoparse僅提供基於格式的代理網路身份驗證,因此您需要使用我們的白名單IP功能在通過代理時跳過傳統身份驗證。
7.IP:PORT 準備好後,根據您的會話類型選擇輪換間隔。如果您使用的是輪換會話類型,請將間隔設置為 1。如果您使用的是粘性會話,請將其設置為 600。最後,單擊確定按鈕。
8.要驗證一切是否正常工作,請在“防阻塞設置”下的“設置”選項旁邊找到複選標記。確認後,單擊“保存”繼續。
9.要從我們的示例頁面中提取數據,請單擊 Octoparse 應用程序頂部看到的 IP 地址,然後選擇提取所選元素的文本。
10.完成後,單擊“保存”,然後單擊“運行”。
11.根據您想要運行任務的方式,選擇可用的提取選項之一。出於測試目的,您可以在設備上運行任務。
12.如果操作正確,任務完成後您應該在提取的數據表中看到我們的代理 IP。
通過以上步驟,你成功完成了Octoparse和代理的集成,為網絡連接提供了更加安全和靈活的選項。
最后更新于
这有帮助吗?