<p id="lnbpp"></p>
    <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

    <address id="lnbpp"></address>

    <address id="lnbpp"></address>
    <noframes id="lnbpp">
    <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
    <sub id="lnbpp"><address id="lnbpp"></address></sub>

        <span id="lnbpp"></span>
        <form id="lnbpp"></form>

        5
        新手入門 功能點介紹

        【智能模式】【流程圖模式】如何設置文件下載

        2021-12-21 19:16:18
        瀏覽 61005 次

        摘要:本教程介紹了如何設置文件下載功能 免費下載軟件

        后羿采集器支持在采集的過程中下載文件,文件類型包括:圖片、音頻、視頻、文檔、其他文件,啟用文件下載功能的位置如下圖所示:

        需要注意的是,此處的設置只是針對文件下載功能的開啟,所有的文件下載都需要在采集字段中設置對應的下載鏈接,無法獲取下載鏈接的文件不支持下載。

        在下載文件時,軟件支持對文件下載路徑進行修改,你可以按照下圖進行設置:

        在下載文件時,軟件支持按照一定的規則創建獨立的文件夾用來存放文件,規則包括按照文件類型、采集日期、任務名稱或者按照字段值給文件夾命名,如下圖所示:

        在下載文件時,軟件支持按照一定的規則重命名下載的文件,規則包括按照原文件名、文件md5值、任務名稱_編號、采集日期_編號、編號、自定義和字段值給下載文件命名,如下圖所示:

        當選擇自定義規則時,可以對不同的固定規則進行組合,從而創建出所需的命名規則,如下圖所示:

        當遇到同名文件時,用戶可以按照以下三種方式進行選擇:

        文件下載可以分為三種類型,第一種是直接點擊下載鏈接下載文件,第二種是通過點擊下載按鈕下載文件,第三種是通過數據處理生成下載鏈接。

        第一種類型:點擊下載鏈接下載文件

        1、圖片

        支持圖片的格式包括jpg、png、gif、jpeg、bmp、eps、psd等主流圖片格式。當我們需要下載圖片時,請勾選圖片選項,如下圖所示:

        下載圖片有以下三種情況:

        (1)下載列表頁的圖片

        (2)下載詳情頁的圖片

        接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這三種情況。

        (1)下載列表頁的圖片

        第一步:點擊添加字段,然后點擊列表中的圖片

        第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

        具體如下動圖所示:

        如果下載列表頁圖片時出現圖片顯示不完整,或者下載后的圖片非常小,或者圖片無法打開,那是因為采集時圖片未完全加載顯示出來,此時可以選擇設置一個更大的請求等待時間,或者在防屏蔽中勾選逐行滾動選項,如下圖所示:

        (2)下載詳情頁的圖片

        如果當前網頁可以通過點擊選中全部想要采集的內容,請按照以下步驟處理:

        第一步:點擊添加字段,然后點擊頁面內容,確保選中內容包含了所有的圖片

        第二步:右擊字段,設置取值屬性為“提取外部HTML”

        如果當前網頁無法通過點擊選中全部想要采集的內容,請按照以下步驟處理:

        第一步:選擇圖片最全的詳情頁作為深入采集的鏈接,然后點擊添加多個字段,分別對應需要采集的圖片

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中包含所有圖片的內容

        第二步:右擊字段,設置取值屬性為“提取外部HTML”

        補充:在下載詳情頁圖片時,如果圖片需要滾動頁面才能顯示出來,此時需要在詳情頁加一個滾動操作。

        在智能模式中,請在詳情頁點擊右上角預執行腳本按鈕,然后在預執行腳本窗口中進行如下設置:

        在流程圖模式中,請直接拖動一個滾動組件放到點擊打開詳情頁的點擊組件之后,具體設置如下所示:

        2、音頻

        支持音頻圖片的格式包括mp3、amr、wav、m4a等主流音頻格式。當我們需要下載音頻時,請勾選音頻選項,如下圖所示。?

        下載音頻有以下兩種情況:

        (1)下載列表頁的音頻

        (2)下載詳情頁的音頻

        接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

        (1)下載列表頁的音頻

        如果可以通過點擊獲取音頻下載鏈接,請按照以下步驟進行操作:

        第一步:點擊添加字段,然后點擊列表中的音頻下載鏈接

        第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        (2)下載詳情頁的音頻

        第一步:點擊添加字段,然后點擊詳情頁中的音頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        3、視頻

        支持音頻圖片的格式包括mp4、avi、mov、3gp、flv等主流視頻格式。當我們需要下載視頻時,請勾選視頻選項,如下圖所示。

        下載視頻有以下兩種情況:

        (1)下載列表頁的視頻

        (2)下載詳情頁的視頻

        接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

        (1)下載列表頁的視頻

        如果可以通過點擊獲取視頻下載鏈接,請按照以下步驟進行操作:

        第一步:點擊添加字段,然后點擊列表中的視頻下載鏈接

        第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        (2)下載詳情頁的視頻

        第一步:點擊添加字段,然后點擊詳情頁中的視頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        4、文檔

        支持文檔的格式包括doc(x)、ppt(x)、xls(x)、pdf、snb、txt等主流文檔格式。當我們需要下載文檔時,請勾選文檔選項,如下圖所示。

        下載文檔有以下兩種情況:

        (1)下載列表頁的文檔

        (2)下載詳情頁的文檔

        接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

        (1)下載列表頁的文檔

        如果可以通過點擊獲取文檔下載鏈接,請按照以下步驟進行操作:

        第一步:點擊添加字段,然后點擊列表中的文檔下載鏈接

        第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        (2)下載詳情頁的文檔

        第一步:點擊添加字段,然后點擊詳情頁中的文檔下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        5、其他文件

        支持其他文件的格式包括apk、exe、rar、zip、gzip、dmg、torrent、epub等主流文件格式。當我們需要下載這些文件時,請勾選其他文件選項,如下圖所示。

        下載其他文件有以下兩種情況:

        (1)下載列表頁的文件

        (2)下載詳情頁的文件

        接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

        (1)下載列表頁的文件

        如果可以通過點擊獲取文件下載鏈接,請按照以下步驟進行操作:

        第一步:點擊添加字段,然后點擊列表中的文件下載鏈接

        第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        (2)下載詳情頁的文檔

        第一步:點擊添加字段,然后點擊詳情頁中的文件下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        如果以上方法無法解決你的需求,請按照以下步驟處理:

        第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

        第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

        第二種類型:點擊下載按鈕下載文件

        針對第二種類型,所有的文件類型設置方式相同,具體步驟如下:

        第一步:點擊添加字段,然后點擊下載按鈕

        第二步:右擊字段,設置取值屬性為“下載按鈕”

        在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

        第三種類型:通過數據處理生成下載鏈接

        針對第三種類型,在進行下載鏈接的數據處理之后,需要再添加一個數據處理步驟,如下圖所示:

        在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

         

        分享到:
        數據自動整理成excel python爬蟲 批量下載視頻 網頁下載成word 批量生成網址 批量下載圖片 php爬蟲 網頁內容關鍵字提取 python數據采集 正則匹配郵箱
        關閉
        解开白丝老师的裙子猛烈进入
        <p id="lnbpp"></p>
          <thead id="lnbpp"><listing id="lnbpp"><listing id="lnbpp"></listing></listing></thead>

          <address id="lnbpp"></address>

          <address id="lnbpp"></address>
          <noframes id="lnbpp">
          <form id="lnbpp"><nobr id="lnbpp"><meter id="lnbpp"></meter></nobr></form>
          <sub id="lnbpp"><address id="lnbpp"></address></sub>

              <span id="lnbpp"></span>
              <form id="lnbpp"></form>