<p id="lnbpp"></p>
  <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

  <address id="lnbpp"></address>

  <address id="lnbpp"></address>
  <noframes id="lnbpp">
  <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
  <sub id="lnbpp"><address id="lnbpp"></address></sub>

    <span id="lnbpp"></span>
    <form id="lnbpp"></form>

    5
    新手入門 功能點介紹

    【智能模式】【流程圖模式】如何設置文件下載

    2021-12-21 19:16:18
    瀏覽 61005 次

    摘要:本教程介紹了如何設置文件下載功能 免費下載軟件

    后羿采集器支持在采集的過程中下載文件,文件類型包括:圖片、音頻、視頻、文檔、其他文件,啟用文件下載功能的位置如下圖所示:

    需要注意的是,此處的設置只是針對文件下載功能的開啟,所有的文件下載都需要在采集字段中設置對應的下載鏈接,無法獲取下載鏈接的文件不支持下載。

    在下載文件時,軟件支持對文件下載路徑進行修改,你可以按照下圖進行設置:

    在下載文件時,軟件支持按照一定的規則創建獨立的文件夾用來存放文件,規則包括按照文件類型、采集日期、任務名稱或者按照字段值給文件夾命名,如下圖所示:

    在下載文件時,軟件支持按照一定的規則重命名下載的文件,規則包括按照原文件名、文件md5值、任務名稱_編號、采集日期_編號、編號、自定義和字段值給下載文件命名,如下圖所示:

    當選擇自定義規則時,可以對不同的固定規則進行組合,從而創建出所需的命名規則,如下圖所示:

    當遇到同名文件時,用戶可以按照以下三種方式進行選擇:

    文件下載可以分為三種類型,第一種是直接點擊下載鏈接下載文件,第二種是通過點擊下載按鈕下載文件,第三種是通過數據處理生成下載鏈接。

    第一種類型:點擊下載鏈接下載文件

    1、圖片

    支持圖片的格式包括jpg、png、gif、jpeg、bmp、eps、psd等主流圖片格式。當我們需要下載圖片時,請勾選圖片選項,如下圖所示:

    下載圖片有以下三種情況:

    (1)下載列表頁的圖片

    (2)下載詳情頁的圖片

    接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這三種情況。

    (1)下載列表頁的圖片

    第一步:點擊添加字段,然后點擊列表中的圖片

    第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

    具體如下動圖所示:

    如果下載列表頁圖片時出現圖片顯示不完整,或者下載后的圖片非常小,或者圖片無法打開,那是因為采集時圖片未完全加載顯示出來,此時可以選擇設置一個更大的請求等待時間,或者在防屏蔽中勾選逐行滾動選項,如下圖所示:

    (2)下載詳情頁的圖片

    如果當前網頁可以通過點擊選中全部想要采集的內容,請按照以下步驟處理:

    第一步:點擊添加字段,然后點擊頁面內容,確保選中內容包含了所有的圖片

    第二步:右擊字段,設置取值屬性為“提取外部HTML”

    如果當前網頁無法通過點擊選中全部想要采集的內容,請按照以下步驟處理:

    第一步:選擇圖片最全的詳情頁作為深入采集的鏈接,然后點擊添加多個字段,分別對應需要采集的圖片

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中包含所有圖片的內容

    第二步:右擊字段,設置取值屬性為“提取外部HTML”

    補充:在下載詳情頁圖片時,如果圖片需要滾動頁面才能顯示出來,此時需要在詳情頁加一個滾動操作。

    在智能模式中,請在詳情頁點擊右上角預執行腳本按鈕,然后在預執行腳本窗口中進行如下設置:

    在流程圖模式中,請直接拖動一個滾動組件放到點擊打開詳情頁的點擊組件之后,具體設置如下所示:

    2、音頻

    支持音頻圖片的格式包括mp3、amr、wav、m4a等主流音頻格式。當我們需要下載音頻時,請勾選音頻選項,如下圖所示。?

    下載音頻有以下兩種情況:

    (1)下載列表頁的音頻

    (2)下載詳情頁的音頻

    接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

    (1)下載列表頁的音頻

    如果可以通過點擊獲取音頻下載鏈接,請按照以下步驟進行操作:

    第一步:點擊添加字段,然后點擊列表中的音頻下載鏈接

    第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    (2)下載詳情頁的音頻

    第一步:點擊添加字段,然后點擊詳情頁中的音頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    3、視頻

    支持音頻圖片的格式包括mp4、avi、mov、3gp、flv等主流視頻格式。當我們需要下載視頻時,請勾選視頻選項,如下圖所示。

    下載視頻有以下兩種情況:

    (1)下載列表頁的視頻

    (2)下載詳情頁的視頻

    接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

    (1)下載列表頁的視頻

    如果可以通過點擊獲取視頻下載鏈接,請按照以下步驟進行操作:

    第一步:點擊添加字段,然后點擊列表中的視頻下載鏈接

    第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    (2)下載詳情頁的視頻

    第一步:點擊添加字段,然后點擊詳情頁中的視頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    4、文檔

    支持文檔的格式包括doc(x)、ppt(x)、xls(x)、pdf、snb、txt等主流文檔格式。當我們需要下載文檔時,請勾選文檔選項,如下圖所示。

    下載文檔有以下兩種情況:

    (1)下載列表頁的文檔

    (2)下載詳情頁的文檔

    接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

    (1)下載列表頁的文檔

    如果可以通過點擊獲取文檔下載鏈接,請按照以下步驟進行操作:

    第一步:點擊添加字段,然后點擊列表中的文檔下載鏈接

    第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    (2)下載詳情頁的文檔

    第一步:點擊添加字段,然后點擊詳情頁中的文檔下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    5、其他文件

    支持其他文件的格式包括apk、exe、rar、zip、gzip、dmg、torrent、epub等主流文件格式。當我們需要下載這些文件時,請勾選其他文件選項,如下圖所示。

    下載其他文件有以下兩種情況:

    (1)下載列表頁的文件

    (2)下載詳情頁的文件

    接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

    (1)下載列表頁的文件

    如果可以通過點擊獲取文件下載鏈接,請按照以下步驟進行操作:

    第一步:點擊添加字段,然后點擊列表中的文件下載鏈接

    第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    (2)下載詳情頁的文檔

    第一步:點擊添加字段,然后點擊詳情頁中的文件下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    如果以上方法無法解決你的需求,請按照以下步驟處理:

    第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

    第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

    第二種類型:點擊下載按鈕下載文件

    針對第二種類型,所有的文件類型設置方式相同,具體步驟如下:

    第一步:點擊添加字段,然后點擊下載按鈕

    第二步:右擊字段,設置取值屬性為“下載按鈕”

    在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

    第三種類型:通過數據處理生成下載鏈接

    針對第三種類型,在進行下載鏈接的數據處理之后,需要再添加一個數據處理步驟,如下圖所示:

    在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

     

    分享到:
    數據自動整理成excel python爬蟲 批量下載視頻 網頁下載成word 批量生成網址 批量下載圖片 php爬蟲 網頁內容關鍵字提取 python數據采集 正則匹配郵箱
    關閉
    解开白丝老师的裙子猛烈进入
    <p id="lnbpp"></p>
     <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

     <address id="lnbpp"></address>

     <address id="lnbpp"></address>
     <noframes id="lnbpp">
     <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
     <sub id="lnbpp"><address id="lnbpp"></address></sub>

       <span id="lnbpp"></span>
       <form id="lnbpp"></form>