<p id="lnbpp"></p>
    <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

    <address id="lnbpp"></address>

    <address id="lnbpp"></address>
    <noframes id="lnbpp">
    <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
    <sub id="lnbpp"><address id="lnbpp"></address></sub>

        <span id="lnbpp"></span>
        <form id="lnbpp"></form>

        5
        新手入門 功能點介紹

        【新手入門】常見問題清單

        2020-10-19 08:56:56
        瀏覽 10119 次

        摘要:本篇教程主要給大家介紹了后羿采集器的常見問題,大家可以在遇到問題時先參考本文進行排查。 免費下載軟件

        1、如果您是新手,請務必先看一下官網視頻講解教程。

        教程地址:http://www.mimosamay.com/?type=videolist

        視頻教程是由我們官方培訓講師給大家講解后羿采集器的使用方法,每一篇教程其實都很簡短,如果大家在開始采集之前先看一下這些視頻講解教程,大部分問題都能得到解答。

         

        2、XX 網站能不能采集?XX 數據能不能采集?

        請先參考第一條。

        官網視頻講解教程中我們已經介紹過,后羿采集器是一款通用網頁采集軟件,只要是有網址,可以通過網頁瀏覽,您能看得見的內容,大多都是可以采集的(視頻比較特殊,得分析具體情況)。

        為了保護您的隱私,您所有的任務及配置都以加密形式存儲于云端,除了您個人外任何人都無法查看具體的內容,您在采集過程中輸入的賬號密碼以及您的采集結果都存在您的本地電腦中。但請您嚴格遵守相關的法律法規,若后羿采集器官方收到任何關于非法采集的舉報,將會第一時間封停該賬號。

         

        3、為什么采集數據提前停止了?

        如果您遇到采集提前停止的問題,請按照以下步驟自檢一下:

        第一步:請確認您在瀏覽器中能看見多少內容

        有的時候搜索顯示數量和你最終能看得見的數量不是一致的,請確認您能看見多少條數據,然后再確定采集是提前停止還是正常停止。

        第二步:采集結果數量和在瀏覽器中看到的數量不一致

        在采集過程中,如果遇到這個問題,有以下兩種可能性:

        第一種可能性是采集速度過快而網頁加載時間過慢,從而導致無法采集到網頁中的數據。

        遇到這種情況時請增加請求等待時間,等待時間長一點之后,就有足夠的時間留給網頁加載內容。

        請求等待時間的設置在 啟動設置—>智能策略中,如下圖所示:

        第二種可能性是你遇到了其他問題

        我們可以通過在運行過程中,點擊運行界面中的“查看網頁”來觀察一下當前的網頁內容是否正常,是否無法正常顯示,是否出現異常提示等。

        如果出現了上述情況,我們可以通過降低采集速度、手動輸入驗證碼等方式,至于哪種方式可以起作用,這個需要您測試后才知道,不同的網站問題不同,沒有一個統一的解決方案。

        如果嘗試了以上方案后仍然無法解決,你可以在幫助中心反饋給我們,我們會為您提供解答。

         

        4、為什么采集字段不全?

        字段不全一般有以下兩種情況:

        第一種,由于列表元素的結構不同,有些元素中有的字段其他元素中沒有,這是正常的現象,請大家先在網頁中確認對應元素中是否存在你想要的字段。

        第二種,頁面結構發生了變化,這種通常會發生在同一個搜索結果中包含多種頁面結構的場景,例如搜索引擎的搜索結果(包含很多種網站)。

        這種情況需要針對具體問題進行分析,您可以導出您的采集任務,發到我們官方的幫助中心,我們的客服會幫您進行測試分析。

         

        5、為什么采集數據重復?

        首先請確認你已經看過視頻教程,你的采集任務沒有頁面類型的設置問題,即錯把單頁類型設置為列表類型,或是你錯誤地理解了循環采集的使用方法。

        然后請確定你是多次反復采集數據出現重復還是某一次單獨采集出現了重復數據。

        在未修改采集任務時,每一次運行采集任務都是從頭開始采集,所以每一次采集的數據都是重復的,這是正常的。

        如果是在單次采集時出現了重復數據,請確認是否滿足以下情況:

        第一種:重復數據均為最后一頁的數據,這種有可能是翻到最后一頁未能停止翻頁,請嘗試修改采集范圍,然后看是否還會出現重復數據的情況。

        第二種:重復數據為中間頁的數據,這種情況無法直接得出結論。

        以上兩種情況下,都請上傳你的采集任務到幫助中心,我們的客服會幫您進行測試分析。

         

        6、采集停止了,再運行是不是從頭開始?

        是的,采集停止之后,下次再直接啟動會默認按照上一次的設置從頭開始采集。

        如果想進行斷點續采,請看這個教程:http://www.mimosamay.com/?type=post&pid=6293

         

        7、軟件崩潰了,重啟后左側數據都是0,數據丟了嗎?

        請放心,已經采集到的數據除非你手動刪除,否則都不會丟失。

        在軟件非正常關閉時,重啟后左側任務采集的數據的數量需要手動刷新,你只需點擊一下那個數字,就會恢復正常。

         

        8、管理員能不能幫我看一下采集任務哪里有問題

        后羿采集器為大家提供了QQ客服和幫助中心兩種解決采集問題的渠道。

        在QQ客服中一般適合提比較簡單的具體問題,管理員看見后能夠通過簡單幾句話幫你解決。

        如果遇到復雜的采集問題,尤其是需要查看采集任務才能知道的問題,建議大家直接發到幫助中心。

        幫助中心的問題會有專人客服跟蹤,所有問題都會得到解答,請大家盡量使用幫助中心來反饋問題。

         

        9、編輯任務時出現驗證碼該怎么辦?

        如果大家在編輯任務時出現了驗證碼,軟件會進行自動檢測并給出提示,請大家根據軟件的提示進行手動輸入驗證碼內容操作。

        需要注意的是,自動檢測會存在一定的誤識別概率,如果你判斷頁面中不需要進行驗證碼操作,點擊取消即可。

        此外,如果軟件并未識別,請點擊右上角“手動輸入驗證碼”(藍色)按鈕進行驗證碼輸入操作。

         

        10、編輯采集任務時頁面無法正常顯示該怎么辦?

        首先請確認你在Chrome瀏覽器中,直接粘貼該網址是否可以訪問。

        如果Chrome瀏覽器無法打開,那么軟件目前就是支持不了的,你可以反饋到幫助中心,我們的客服會幫您進行測試和分析。

        如果瀏覽器中可以訪問,但是軟件中無法訪問,請點擊右上角“手動打碼”(藍色)按鈕,然后在彈出的窗口中點擊訪問你輸入網址的網站的首頁,例如點擊左上角的網站LOGO或首頁按鈕之類的。

        在正常打開首頁之后,點擊預登錄窗口右下角的驗證完成按鈕,這樣軟件中應該就可以正常訪問了。

        某些網址可能不允許用戶在未訪問過首頁或列表頁的情況下直接訪問詳情頁,所以盡量不要直接從詳情頁開始采集,可以選擇從列表頁開始采集。

         

        11、運行過程中需要輸入驗證碼該怎么辦?

        針對這種情況,后羿采集器支持驗證碼手動輸入驗證碼,不支持自動打碼。

        固定位置的驗證碼打碼,請參考這個教程:http://www.mimosamay.com/?type=post&pid=4900

        運行過程中的驗證碼軟件會自動檢測并給出這里有驗證碼的提示。

        具體過程請按照軟件提示操作即可。

        需要注意的是,軟件在運行過程中自動檢測驗證碼并彈出提示時,采集任務會暫停下來,手動輸入驗證碼之后軟件就會繼續運行當前任務。此外,自動識別驗證碼存在一定的誤識別概率,如果你判斷頁面中實際沒有驗證碼,點擊跳過即可,連續跳過兩次之后軟件將不再檢測驗證碼。

         

        12、發布到數據庫報錯怎么辦?

        (1)連接問題總結

        1)寶塔控制面板

        使用此管理工具時需要注意mysql數據庫訪問權限設置,和遠程訪問端口的開放。

        2) localhost、192.168.xxx.xxx

        使用此類主機地址需要注意是本機需要開啟MySQL服務

        3)不確定報錯詳請

        可使用navicat先確定具體報錯詳情

        (2)字段映射問題總結

        1)字段類型

        僅支持數據表中字符串和整型字段的映射(如果需要映射日期字段,需要將數據表中對應字段改成字符串類型)

        2)字段長度

        需要注意字段長度是否可以滿足本地采集的數據長度

        (3)導出中的錯誤日志總結:

        mysql插入數據時出現Incorrect string value: ‘\xF0\x9F…’ for column ‘name’ at row 1的異常,原因是UTF-8編碼有可能是兩個、三個、四個字節。Emoji表情或者某些特殊字符是4個字節,而 mysql 的utf8編碼最多3個字節,所以數據插不進去。解決方法如下:

        在mysql的安裝目錄下找到my.ini,作如下修改:

        [mysql] default-character-set=utf8mb4 [mysqld] character-set-server=utf8mb4
        修改后重啟Mysql ? ?sudo service mysql restart

        通過管理工具將已經建好的表以及相應的字段也轉換成utf8mb4

         

        分享到:
        批量下載圖片 python爬蟲 批量生成網址 正則匹配郵箱 php爬蟲 批量下載視頻 網頁內容關鍵字提取 python數據采集 網頁下載成word 數據自動整理成excel
        關閉
        解开白丝老师的裙子猛烈进入
        <p id="lnbpp"></p>
          <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

          <address id="lnbpp"></address>

          <address id="lnbpp"></address>
          <noframes id="lnbpp">
          <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
          <sub id="lnbpp"><address id="lnbpp"></address></sub>

              <span id="lnbpp"></span>
              <form id="lnbpp"></form>