Webをキャプチャして変換するツール

製品リストと詳細ページを削る方法

Webサイトには、多くの場合、アイテムのリストを含む検索ページがあり、各アイテムには、アイテムの詳細情報を含む詳細ページへのリンクを含む概要説明が表示されます。

この構造は頻繁に使用されるため、各ページに関する情報を検索ページから取得し、残りを詳細ページから取得する必要があります。 この記事では、そのような情報を収集する方法についてのガイダンスを提供します。

最初に、取得する製品リストページのURLを入力します。 次に、製品リストページから選択する情報を選択します。 データの例がすべて選択されていることを確認してください。

次に、スクレイプ手順ページで、をクリックします スクレイプ命令を追加.

最初に注意することは、スクレイパーがブラウザーとまったく同じように機能するため、ページのクリックを停止するCookieセキュリティ通知またはその他のインラインポップアップがある場合、スクレイパーにポップアップを閉じるように指示する必要があることです。残りのスクレイプは実行できます。 これらのポップアップのほとんどは1回クリックするだけでよいため、GrabzItに同じことを行うように指示できます。 これを行うには、 要素をクリック アクションを実行し、ポップアップを閉じるために必要なHTML要素をクリックします。 次に、[1回のみ]オプションをクリックします Save そして次。

次に、 データを抽出 アクションを実行してから、抽出するデータを選択します。 そのため、検索結果のリストからアイテムのタイトルを選択する場合。 そのリストのすべてのタイトルが選択されていることを確認してください。

ウィザードはデータのセットを自動的に識別しようとするため、必要以上の情報を自動的に選択する場合があります。 これが発生した場合は、選択したくない項目をもう一度クリックするだけで、それらは含まれなくなります。 これは、Webスクレーパーに何を抽出するかを教えます。

次に、抽出するデータ項目の属性を選択します。 「テキスト」などをクリックし、「次へ」をクリックします。 次の画面でタイトルを付けます。 ここでは、すべてのデータでデフォルトテンプレートを使用することに注意してください。 これは、特別なテンプレート上にない場合にデータを抽出するためです。

製品検索ページから抽出するすべてのアイテムデータを選択したら。 製品詳細ページの詳細については、すべてのリンクを選択してください。 これは、たとえば画像です。 次に、 要素をクリック アクション。 テンプレートを「詳細」に設定し、5秒の遅延を与えて、「次へ」をクリックします。 新しいページからデータを抽出するかどうかを尋ねられたら、yesを選択します。 次に、以前と同様に抽出するデータを選択します。 ただし、今回は、「詳細」テンプレートの下で実行する必要があることを指定します。

別のスクレイプ指示を追加して、メインページに戻ります。 今回は、ページネーションリンクから次のボタンを選択します。 とき アクションをクリック オプションボックスが表示されますを選択してください 次ページボタン オプション。 このようにして、スクレーパーはこのボタンが実際にはページネーションボタンであることを認識し、すべての結果をページネーションします。 このスクレイプ指示が最後にあることを確認してください。 最後のスクレイプ命令でない場合は、最後までドラッグできます。

次に、[スケジュール]タブに移動し、[作成]をクリックしてスクレイプを開始します。 スクレイプの行アイコンをクリックしてからスクレイパーのビューアーアイコンをクリックすると、スクレイプの進行状況をリアルタイムで見ることができます。