Webをキャプチャして変換するツール

Web Scraperドキュメント

Webスクレイプを作成するには、次のタブに広がる5種類の情報を指定する必要があります。

  1. スクレープオプション
  2. ターゲットWebサイト
  3. スクレイプ手順
  4. エクスポートオプション
  5. スケジュールスクレイプ

スクレープオプション

以下のすべての機能を使用して、[スクレイプオプション]タブでWebスクレイプをカスタマイズできます。

スクレープ名 スクレイプの名前。

リンクをたどる スクレーパーがリンクをたどる方法に関する次のオプションを提供します。

  • 必要に応じて-デフォルト設定と最も安全なオプション。これにより、スクレーパーは指示されたリンクのみをたどります
  • すべてのページ-スクレーパーは、見つかったすべてのリンクをたどります
  • 最初のページ-最初のページにあるリンクのみをたどり、ターゲットとして指定します
  • 以下 n 最初のページからのページ-最初のページから指定されたクリック数のページのリンクのみをたどる
  • フレーム内-フレームおよびiframeにあるリンクをたどる

Robots.txtファイルを無視 設定されている場合、スクレイパーは通常、Webサイトの所有者によるクロールから除外されているWebページにアクセスできます。

ファイルのダウンロードを無視 一度リンクを設定すると、アクセス時にファイルのダウンロードが発生しますが、ダウンロードされません。

重複を無視 設定すると、設定した類似度以上のページが無視されます。たとえば、95%が同じページは無視できます。

制限スクレープ Webスクレイパーが停止するまでにスクレイピングするページ数を指定できます。

私のタイムゾーンを使用 設定されている場合、Webスクレイパーは、スクレイピングする日付を変換しようとすることを示します intoローカルタイムゾーン。 タイムゾーンはアカウントページで設定できます。

ロケーション Web Scraperがスクレイプを実行する地理的位置。 これは、ターゲットWebサイトに場所に基づく制限がある場合に便利です。

デフォルトの日付形式 日付形式を決定できない日付を変換する場合、Web Scraperは代わりにこの選択された形式にデフォルト設定します。

ページ読み込み遅延 これは、Web Scraperがページを解析する前に待機するミリ秒単位の時間です。 これは、ページに多くのAJAXが含まれているか、ロードが遅い場合に非常に便利です。

ターゲットWebサイト

ターゲットWebサイト

[ターゲットWebサイト]タブで、データを抽出するWebサイトを指定します。 スクレイプツールにWebサイトからデータを抽出するように指示するには、まずメインのURLを指定する必要があります int例えばに夢中 http://www.example.com/shop/ これは、スクレイパーがスクレイプを開始する場所であり、通常のWebページ、PDFドキュメント、XMLドキュメント、JSONドキュメント、RSSフィード、またはサイトマップです。 WebページまたはPDFドキュメントではない場合、スクレイパーはファイル内のすべてのリンクを見つけて、それぞれにアクセスします。

ターゲットURLにあるリンクのみをたどり、後続のページをたどらないようにするには、 リンクをたどる こすりオプション 〜へ 最初のページ。 これは、残りのスクレイプをシードするためにのみターゲットURLを使用します。

デフォルトでは、Webスクレイパーは、アクセスする各Webページで検出したすべてのリンクをたどります。 リンクするものを制限する場合 Webスクレーパー 次に、これを行う簡単な方法の1つは、URLパターンを指定することです。 これは、ワイルドカードとしてアスタリスクを使用してURLを指定し、パターンのこの部分に任意の文字が存在できることを示すことにより機能します。 例えば http://www.example.com/*/articles/* Webサイトのルートから2番目のディレクトリとして記事があるURLをすべてスクレイピングします。

URLは、ログインフォームなどのPOSTのパラメーターでURLを指定することもできます。 そのためには、[ターゲットURL]テキストボックスにフォームのURLを指定し、使用する必要な投稿パラメーターを追加します。 ポスト変数値には、次のような特別なGrabzIt変数を含めることもできます。

  • {{day}} – 2桁の値としての日
  • {{month}} – 2桁の値としての月
  • {{year}} – 4桁の値としての年
  • {{hour}} – 2桁の値としての時間
  • {{minute}} – 2桁の値としての分
  • {{second}} – 2桁の値としての秒

最後に指定できます シードURL それらのURLが確実にスクレイピングされるようにします。

シードURL

シードURLを使用すると、ユーザーはWeb Scraperでクロールする必要があるURLのリストを指定できます。 シードURLのみを取得する場合は、 リンクをたどる こすりオプション 〜へ ページなし [スクレープオプション]タブで。

[ターゲットWebサイト]タブでシードURLを設定するには、[ターゲットの追加]ボタンをクリックし、[シードURLの設定]チェックボックスをオンにして、スクレイプする各URLを個別の行に指定します。

テンプレートURLからシードURLを作成します

あるいは、テンプレートURLを使用してシードURLを自動的に生成できます。これは、URL変数を含む単一のURLです。 URL変数は、反復される数値の範囲を指定します。

{{start number|finish number|iterate number}}

  • 開始番号 URL変数が始まる番号
  • 終了番号 URL変数が終わる番号
  • 繰り返し数 URL変数が反復処理する番号

開始番号はURL変数のカウントを開始する番号、終了番号はURL変数のカウントを停止する番号、反復番号はURL変数の反復ごとに増加する番号です。

たとえば、次のテンプレートURLの場合 http://www.example.com/search?pageNo={{1|3|1}}

これにより、次のシードURLが作成されます。

  • http://www.example.com/search?pageNo=1
  • http://www.example.com/search?pageNo=2
  • http://www.example.com/search?pageNo=3

スクレイプ手順

スクレイプの指示は、ターゲットWebサイトをスクレイピングするときに実行するアクションをWebスクレーパーに伝えます。 [スクレイプ手順]タブには、デフォルトでスクレイプウィザードが表示されます。これにより、必要なスクレイプ手順を簡単に追加できます。 開始するには 新しいスクレイプ命令を追加 リンクをクリックします。

これによりウィザードが開き、ターゲットURLが自動的にロードされるため、スクレイピングするものをすぐに選択できます。 WebページまたはPDFドキュメントが読み込まれている場合、任意のリンクをクリックすると、たとえば別のWebページへのナビゲーションなど、通常どおりに動作します。 画面の下部にあるこのpoで、いずれかのアクションを選択するまでint コンテンツをクリックすると、抽出または操作するHTML要素が選択されます。

スクレイプ命令について最初に理解することは、デフォルトですべてのWebページで実行されることです。 これを止める方法は、テンプレートを使用することです。 リンクをクリックするなどのアクションを実行するときにテンプレートを割り当てることができるため、スクレイパーがそのリンクにアクセスするか、そのボタンをクリックするたびに、割り当てられたテンプレートに属していることが認識されます。 これにより、さまざまなページタイプを定義できます。 たとえば、いくつかの概要情報を含む製品カテゴリページがあり、次に製品情報を含む詳細ページがあるとします。 おそらく両方のページに、異なるスクレイプ指示のセットが必要です。

スクレーパーテンプレート

開始するには、 ナビゲーションヘッダーの アクションを実行し、アクションを実行するアイテムを選択して、 ボタンにテンプレートの名前を入力します テンプレートを作成する スクレーパーがこれらのアクションを実行するたびにテキストボックスが表示され、返されるテンプレートは指定した名前になります。

次に、特定のテンプレートをスクレイプ指示に割り当てるには、目的のテンプレートを選択する必要があります 実行する スクレイプ指示が追加される直前に表示されるオプションウィンドウに表示されるドロップダウンリスト。 テンプレートを選択するときの3つの主なオプションは次のとおりです。

  • すべてのページ -このスクレイプ指示にはテンプレートを使用しないでください。スクレイプ指示はすべてのWebページで実行されます。
  • 既定のテンプレート -ユーザー定義のテンプレートを使用しないでください。 スクレイプ命令は、テンプレートが指定されていないWebページで実行されます。
  • ユーザー定義テンプレート -特定のWebページまたはアクションを識別するためにユーザーが定義したテンプレートの1つ。

これらのオプションのいずれかを選択すると、指定されたテンプレートでのみスクレイプ命令が実行されます。

データの抽出

を選択すると、 データを抽出 アクションすぐに抽出する一連のデータ項目は、画面の左下隅でダウンロードできるようになります。 これらは、ダウンロード可能なページ全体のプロパティです。 いずれかを選択するには、オプションのリストから選択してクリックします データを追加する データセット.

関連するHTML要素をクリックする必要があるページ全体に属するのではなく、特定のHTML要素のデータを抽出する場合は、単一または複数のアイテムを選択できます。 ただし、複数のアイテムを選択する場合は、列の複数行など、同じ複数のアイテムを選択してみてください。選択したデータのコレクションを一意に識別できるルールをスクレイパーが作成できない場合、スクレイプ指示は実行されません。作成することができます。 さらに、クリックしている複数のアイテムがWebスクレイパーウィザードによって繰り返しデータとして識別されている場合、同じグループ内のすべての繰り返しデータが自動的に選択されます。 単一または複数のアイテムをすべて選択したら、画面の左下から抽出する属性を選択して、クリックします .

データセットの作成

データセット画面では、データの処理方法を変更できます。たとえば、データセットとその中の列の名前を変更できます。名前をクリックして名前を変更します。 データセットに列を追加するときは、実行するテンプレートも選択する必要があります。列名の下にあるドロップダウンリストをクリックして、これを変更できます。

多くの場合、データを抽出するとき、いくつかの繰り返しアイテムが一貫性なく繰り返されることがよくあります。 リンク列 一貫性のない列をデータセット内の最も一貫性のある列にリンクするための基準。

データセットにさらにデータを追加するには、をクリックします ボタン、またはクリック データセットからデータを削除する、または データセット全体を削除します。 データセットでは、さまざまな基準をデータに適用することもできます。これを行うには、上部から目的のアクションを選択し、関連する列をクリックして基準を適用します。 条件の追加を間違えた場合は、 ボタン。

さまざまな基準タイプのリストとそれらの使用方法を以下に示します。

  • 行を制限する -これにより、Webページから抽出される行の数が、定義した数に制限されます。 クリックを使用するには 次に、切り捨てる行を超えてクリックします。
  • 繰り返す -列が最長の列の長さと一致するまで列項目を繰り返します。 クリックするだけで使用できます アイテムを繰り返す列をクリックします。
  • ユニークにする -入力されたすべての値の重複する値を削除します int列。 クリックするだけで使用できます 次に、一意にする列をクリックします。
  • 値を抽出する -テキストブロックから一致するデータ項目のみを抽出するパターンを指定します。 クリックするだけで使用できます 、関連する列を選択し、指示に従って、関連するデータを返すパターンを作成します string.
  • トリム値 -冗長テキストを削除するパターンを指定します。 クリックするだけで使用できます 、関連する列を選択し、指示に従ってテキストをトリミングするパターンを作成します。
  • リンク列 -列を一緒にリンクできます。 そのため、データの抽出時に、結果の数に不一致がある場合でも、リンクされた列の相対行と同じ行にレコードが表示されます。 クリックするだけで使用できます 、リンクする列を選択してから、リンクする列を選択します。
  • 列を非表示 -フィルタリングする列を含めたいが、最終結果に値を含めたくない場合があります。 これを行うには、クリックするだけです 、除外する列を選択します。
  • ソート昇順 -列で昇順でソートします。 クリックを使用するには 並べ替える列を選択します。
  • 降順で並べ替え -列で降順でソートします。 クリックを使用するには 並べ替える列を選択します。
  • 含まれています -定義された値を含む値のみを含めます。 クリックを使用するには 目的の列を選択し、列の値に含める値を入力します。
  • に等しい -定義された値と等しい値のみを含めます。 クリックを使用するには 目的の列を選択してから、列の値が等しくなる値を入力します。
  • 等しくない -定義された値と等しくない値のみを含めます。 クリックを使用するには 目的の列を選択し、列が等しくない値を入力します。
  • 未満 -定義された値より小さい値のみを含めます。 クリックを使用するには 目的の列を選択し、列の値よりも小さい値を入力します。
  • より大きい -定義された値より大きい値のみを含めます。 クリックを使用するには 目的の列を選択し、列の値よりも大きい値を入力します。

上記の操作のいずれかを選択すると、複数の列に影響を与える可能性がある場合、列のサブセットまたはすべての列のみに影響を許可するかどうかを尋ねられます。 ほとんどの場合、すべての列に影響を与える必要がありますが、状況によっては、影響を受ける列を制限すると便利です。 たとえば、一連の ラベルと値、すべてのラベルと値を選択できるWebページ間で位置を変更します。 次に、データセットでequals操作を使用して目的のラベルに制限し、ラベルと値の列のみが影響を受けるように指定します。 これにより、他の列が削除される行の影響を受けないことが保証されます。完全を期すために、ラベル列を非表示にすると便利です。

必要なものをすべて変更したら、クリックします そして、スクレイプの説明がスクレイプに追加されます。

Webページの操作

Webページは、クリックして入力し、ドロップダウンから値を選択することにより、スクレイピングされる前に操作できます。 これにより、新しいWebページが読み込まれる可能性がありますが、適用可能なすべてのスクレイプ命令が実行されるまで、スクレイプ命令は再起動されないことに注意してください。

ウェブページを操作するには、次のいずれかを選択します 要素をクリック, ホバー要素, スクロール, テキストを入力 or ドロップダウンリストの値を選択 行動。 クリックアクションを実行している場合、Webページ上の任意の数の要素をクリックできます。 それ以外の場合は、適切なHTML要素を選択する必要があります。たとえば、テキストボックスにテキストを入力する必要があります。 次にクリック 。 これにより、アクションを完了するためのオプションボックスが開きます。 テキストを入力してドロップダウンから選択する場合、入力または選択するデータをそれぞれ選択する必要があります。 それ以外は、オプションは3つすべてのアクションで同じです。

希望する場合は、クリックアクションが完了したら、このアクションを実行するテンプレートを選択し、クリックアクションに対して適用するテンプレートを選択できます。 ただし、同じページで複数のクリックを実行するクリックアクションに新しいテンプレートを割り当てることは、インラインポップアップを開いたり、画面に表示したりするなど、良いアイデアではありません。 これは、クリックアクションが特定のテンプレートでのみ実行される場合、最初のクリックで割り当てられた新しいテンプレートはリセットされないため、スクレイプの記述方法によっては、実行中の同じページでの今後のクリックが停止する可能性があるためです。 このアクションを一度だけ実行するかどうかを定義することもできます。これは、ログインなどの操作を行う場合に便利です intウェブサイト。

テキストの入力アクションまたはドロップダウンリスト値の選択アクションを使用すると、それぞれ複数のテキスト項目を入力したり、複数の選択ボックスを選択したりできます。 これらは、スクレイプ手順をクリックして編集できます 変数の変更または表示 左のスクリーンショットに示すように、ボタン。

これは、たとえば検索ボックスに名前のリストを入力する場合に重要です。 検索ボックスに値がある場合にのみフォームが送信されるようにするには、テキストが正常に入力されるたびにテンプレートを設定できます intoこのテンプレートが設定されていない限り、テキストボックスとボタンのクリックアクションは実行されません。 クリックアクションを実行した後、プロシージャをリセットするには、テンプレートを別のものに変更する必要があります。

Webサイトを操作するアクションが実行された後、アクションがAJAX機能を開始するまでしばらく待ってから、スクレイプを続行する前にAJAXコンテンツをロードできると便利です。 これを行うには、遅延を追加します 実行待機後 テキストボックス。

何らかの条件が満たされたら、別のURLに直接ジャンプできます。 これを行うには、 URLに移動 少なくとも1つのテンプレートがスクレイプで定義されており、作成時にテンプレートに割り当てる必要がある場合にのみ表示されるアクションは、無限ループを回避するのに役立ちます。

最後に、WebスクレイプでGrabzItのすべてのキャプチャAPIを使用し、[Webページのキャプチャ]アクションを選択して、目的のキャプチャを選択できます。 これを制限して、スクレイプ内の特定のWebページをキャプチャすることができます。 ボタン。

すべてのスクレイプ指示が追加された後、それはスクレイプ指示パネルに表示されます。各スクレイプ指示の横にある十字は、スクレイプ指示を削除できます。 他のスクレイプ指示に必要なスクレイプ指示が削除されると、それらの指示も削除されます。 スクレイプ指示の順序を変更するには、グラブアイコンでスクレイプ指示をドラッグします。

スクレイプ手順を手動で記述する

スクレイプ命令をより具体的な方法でカスタマイズする必要がある場合、またはコードを実行する場合 擦り傷の前後 スクレイプ手順を手動で変更する必要があります。

スクレイプ命令はJavaScriptベースであり、コードエディターには構文チェッカー、オートコンプリート、ツールチップが付属しており、できる限り簡単になります。

Webスクレーパーの手順 スクリーンショットに示すように、コードエディターのコア機能にはメニューオプションからアクセスできます。それぞれの目的については、以下で個別に説明します。 スクレイプ命令の構文エラーは、コードエディターの左側の溝に表示されます。

ウィザード ウィザードを使用すると、抽出するページの一部を選択し、Webキャプチャの作成などの他の一般的なタスクを実行できます。

スクレイプ手順の表示 スクレイプ指示コードをユーザーに表示します。

すべての指示を削除 すべてのスクレイプ指示を削除します。

ウェブページ機能 Pageキーワードを入力します intoスクレイプの手順とオートコンプリートを開きます。 ページ機能。 ページ関数を使用すると、Webページからデータを抽出できます。

データ関数 Dataキーワードを入力します intoスクレイプの説明。 データ関数 あなたを許可する save 情報を表示します。

ナビゲーション機能 ナビゲーションキーワードを入力します intoコードエディター。 の ナビゲーション機能 Web ScraperがターゲットWebサイトをナビゲートする方法を制御できます。

グローバル関数 Globalキーワードを入力します intoスクレイプの説明。 これにより、 機能 異なるWebページの解析間でデータを保存できます。 スクレイプ命令を記述する場合、スクレイパーがWebページ間を移動するときに、グローバル関数を使用してスクレイパー命令のJavaScript変数の状態が保持されないことを覚えておくことが重要です。 save 以下に示す変数。

Global.set("myvariable", "hello");
var mrvar = Global.get("myvariable");

永続的なグローバル変数を作成するには、以下に示すように、Global.setメソッドのpersistパラメーターにtrueを渡します。

Global.set("myvariable", "hello", true);

ユーティリティ関数 ユーティリティキーワードを入力します intoスクレイプの説明。 これにより、使用することができます 一般的な機能 クエリの追加や削除など、スクレイプの作成を容易にしますstring URLからのパラメーター。

基準関数 Criteriaキーワードを入力します intoスクレイプの説明。 これら 機能 重複を排除するなど、スクレイピング中に抽出されたデータを調整できます。

フィルタ フィルタを簡単に作成できます。これは、Webページ内から特定のHTML要素を選択するために一部の関数で必要です。 ターゲット要素に必要な属性を選択するか、要素の親がその要素を選択する必要があります。 このオプションをクリックする前に、カーソルが関数内の正しい場所にあり、フィルターも通過することを確認してください。

スクリーンショット機能 スクリーンショットオプションを設定できます。 ツールチップで識別されるように、関数の正しい部分にカーソルを置き、スクリーンショットオプションを押します。 次に、必要なオプションをすべて選択して、コマンドを挿入します。

スクレイプの前後にアクションを実行する

Scrape Instructionsタブの上部にあるオプションのドロップダウンリストを使用して、スクレイプの前または後にコマンドを実行できます。 入力されたコマンド スクレイプ後に実行 選択すると、スクレイプが終了した後に実行されます。 コマンドが入力されたとき スクレイプの前に実行 選択すると、スクレイプが開始される前に実行されます。

ただし、これらの2つの特別なモードのいずれかでは、利用可能なスクレイプ命令のサブセットのみが存在します。 使用可能なコマンドは、データ、グローバル、およびナビゲーションスクレイプ命令です。

Strings

Stringsは、Webスクレイプを実行するときに、テキストを定義するためのスクレイプ指示で使用されます。 A string double(")または一重引用符(')。 もし string 二重引用符で始まる場合、二重引用符で終わる必要があります。 string 単一引用符で始まり、単一引用符で終わる必要があります。 例えば:

"my-class"'my-class'

発生する可能性のある一般的なエラーは、閉じられていないことです string エラー、これは string 上記のように閉じ引用符がないか、 string。 以下は違法です strings:

"my
class"

"my class

このエラーを修正するには、次のように改行が含まれておらず、一致する引用符が含まれていることを確認します。

"my class""my class"

一重引用符または二重引用符を string。 これを行う最も簡単な方法は、単一引用符を string 二重引用符と二重引用符で区切られた string 次のように、単一引用符で区切られます。

"Bob's shop"'"The best store on the web"'

または、バックスラッシュを使用して、次のように引用符をエスケープできます。

'test\'s'

一般的な手動スクレイプタスク

リンクチェッカー カスタムリンクチェッカーを作成する -これらの簡単な手順に従って、カスタムリンクチェッカーを作成する方法を見つけてください。
画像ダウンロード Webサイトからすべての画像をダウンロードする -ウェブサイト全体からすべての画像をダウンロードする方法を見つけます。
データセットを作成 データを抽出して変換する intデータセット -スクレイピングしているWebサイトからデータセットを作成する方法を見つけます。
リンクを抽出 Webサイトからリンクを抽出する -ウェブサイト全体からすべてのHTMLリンクを抽出する方法を見つけ、 save あなたが望む形式でそれらを。
テキストを選択 パターンを使用してテキストから値を抽出する -パターンを使用してテキストブロックから値を抽出する方法を見つけます。
OCR 画像からテキストを抽出する -画像内に含まれるテキストを抽出する方法を見つけます。
データセット データセットを埋め込む方法 -パディングを使用して、抽出データをより適切にフォーマットします。
配列 配列の操作 -特別な配列ユーティリティメソッドを使用して、スクレイプ内の配列を簡単に処理する方法を見つけます。
アクション スクレイプ中にアクションを一度だけ実行する -スクレイプ全体でアクションを1回だけ実行する方法を見つけます。
リファイン スクレイピングされたデータの精製 -スクレイプから不要なデータを削除する方法を見つけます。
メールアドレス ウェブサイトからメールアドレスを削る -ウェブサイトからすべてのメールアドレスを取得する方法を見つけます。
スクリーンショット ウェブサイト全体のスクリーンショット into PDFまたは画像 -GrabzItのWeb Scraperを使用してWebサイト全体のすべてのページをキャプチャする方法を見つけます。
スクリーンショット 非構造化テキストから構造化情報を抽出する -GrabzItを使用して、感情、名前、場所、および組織を抽出します。

HTML以外のコンテンツのスクレイピング

Web ScraperがPDF、XML、JSON、およびRSSに遭遇すると、それをHTML近似に変換します。これにより、Web Scraperはそれを正しく解析し、抽出するコンテンツを選択できます。 たとえば、JSONデータを解析する場合、データを変換します int横に表示される階層的なHTML表現。 これにより、通常どおりスクレイプ命令を作成できます。

同様に、スクレイパーがPDFドキュメントをロードすると、PDFが変換されます into画像、ハイパーリンク、テキスト、表を選択してスクレイピングできるHTML。 ただし、PDFには実際の構造がないため、テーブルはヒューリスティックを使用して識別されるため、常に正確であるとは限りません。

エクスポートオプション

このタブでは、Excelスプレッドシート、XML、JSON、CSV、SQLコマンド、HTMLドキュメントなど、オプションの結果をエクスポートする方法を選択できます。 さらに、このタブでは、圧縮されたスクレイプ結果の名前を設定できます。 ファイルのダウンロードまたはWebキャプチャの作成のみを行う場合、結果を含むZIPファイルを受信するだけなので、エクスポートオプションを選択する必要はありません。 このタブでは、結果の送信方法を指定することもできます。 結果を送信することができます アマゾンS3, ドロップボックス、 電子メール通知、 FTPWebDavの.

最後のオプションは、コールバックURLです。これを使用すると、アプリケーションでスクレイプ結果を処理できます。 スクレイプAPI.

圧縮された結果のファイル名または個別に送信するように要求する場合の各データファイルは、[デフォルトのファイル名を使用]オプションをオフにし、目的のファイル名を設定することで設定できます。

スケジュールスクレイプ

Webスクレイプを作成する場合、[スケジュールスクレイプ]タブを使用すると、スクレイプを開始するタイミングと、スクレイプを繰り返したい場合は、その頻度を設定できます。

スクラップの監視とデバッグ

Webスクレイプが開始されると、ステータスアイコンがに変わります 処理されたページは時間とともに増加し始めます。 スクレイパーの進行状況のリアルタイムスナップショットが定期的に作成され、ログファイルとスクレーパーが最後に遭遇したWebページの定期的なスクリーンショットが生成されます。 これにより、スクレイピング中に何が起こっているかを確認できます。 この情報を見つけるには、スクレイプの横にある展開アイコンをクリックしてクリックします ビューアー スクレイプのためにあなたは intこれは、スクレイプの指示に関する問題などのエラーがあった場合に詳述する必要があります。

スクレイプが正常に完了すると、ステータスアイコンが 、ビューアを開いても結果が得られない場合は、ログと最後のスクリーンショットで何が問題だったのかがわかります。

ログで報告される最も一般的な問題の1つは、ページをスクレイピングするのに十分なレンダリング遅延がないことです。多くの場合、 ページ読み込み遅延 にあります スクレープオプション ほとんどのウェブサイトではタブで十分です。