Webをキャプチャして変換するツール

GrabzItのWeb Scraper API、Data as a Service!

GrabzItのWeb Scraper APIを使用して、アプリケーションにWebサービスとしてスクレイピングされたデータを提供し、 int収集した情報を元に戻す intoアプリケーション。 の intデータの統合 intoアプリケーションは、コールバックハンドラーを介して実現されます。コールバックハンドラーは、送信元のデータを処理する公開アクセス可能なURL上のスクリプトまたはアプリケーションです GrabzItのWebスクレーパー。 完全なファイルはこのコールバックハンドラーに順番に送信されるため、たとえば、一連の画像で開始してから、 JSONの JSONファイルのデータは、クライアントライブラリのヘルパーメソッドを使用して簡単に解析できます。 また、このAPIを使用すると、アプリケーションでスクレイプの開始と停止のタイミングを自動的に制御したり、結果の再送信をリクエストしたりできます。

最初に始めるには スクレイプを作成する その後選ぶ コールバックURLオプション [エクスポートオプション]タブから、コールバックハンドラーへのURLを入力します。 http://www.example.com/handler/

コールバックハンドラに問題がある場合は、[スクレイプオプション]タブから[デバッグモード]を選択します。 これにより、コールバックハンドラによって返された応答が出力されます intoログ。

コールバックハンドラー

コールバックハンドラ内でスクレイピングされたデータを処理するには、[エクスポート]タブでJSONまたはXMLオプションを選択します。これにより、オブジェクト指向言語で簡単に読み取れる形式でデータが返されます。

JSONデータでもXMLデータでもないデータの場合、データは機械可読性が低いため、処理オプションが制限されます。 save ディスクまたはデータベース内のファイル。

助けるために int統合プロセスGrabzItは、以下の言語用に次のスクレイパーAPIを提供します。 ただし、コードはオープンソースであり、 GitHubの ここにリストされていないプログラミング言語用に作成できない理由はありません。 ライブラリを作成します。 あなたがそうするなら、なぜそれを世界と共有しませんか?

ASP.NET Scraper API PHP Scraper API Python Scraper API

コールバックハンドラーは、 intGrabzItのWebスクレーパーとアプリケーションを統合することもできます intAmazon S3、Dropbox、FTP、およびWebDavを介して統合します。