Webをキャプチャして変換するツール
GrabzItのオンラインコミュニティ

サポートが必要な初心者 (最初は間違ったエリアに投稿されました)

GrabzItのスクリーンショットツールの使用方法について質問します。

こんにちはコミュニティ、

私の無知をお許しください。私はビジネスマンであり、技術者ではありません。それは私の質問にも必ず反映されると思います。

Web スクレイプ ツールで、URL パターン (最も重要) やスクリーンショット ツールのフォロー ライン制御設定など、より堅牢な選択および制御パラメーターを使用することは可能ですか。私が望むのは、クロールの深さのレイヤー数を制限しながら、ベース URL とその URL から拡張ドメインをクロールすることだけです。私の目的は、特定のドメイン セットからニュース記事を取得することだけです。テキストだけを出力として取り込みたいのですが、docx で配信される画像でも問題ありません。スクリーンショット ツールからの出力は、基本的な要件を満たしている私にとっては素晴らしいものですが、選択と制御の機能が制限されすぎています。そのツールの標準入力を使用するには、すべてのサブドメインと記事名を知っている必要がありますが、それは現実的ではありません。

スクレーパーは素晴らしいだろうと思って使い始めましたが、すぐにそのツールの価格と制限がかなり大きいことに気づきました。そのコスト構造に基づいてそれを使用することは私には現実的ではありません。

注: API をいじって遊んでいる Python を書いているプログラマーがいますが、彼女はこのツールについての知識がなく、私の期待について互いに明確にコミュニケーションするのに課題を抱えているため、彼女の仕事が次のような方向に進んでいるのではないかと心配しています。私にとって最適ではありません。具体的には、Web スクレイパーと同じ入力コントロールを、スクリーンショット ツール用に使いたいと伝えました。しかし、彼女は私の問題を理解していないか、評価しているとは思えません。 API を使用して、ウェブスクラプターの法外な高額な料金を支払わずに、堅牢な選択基準を活用することは可能ですか?

任意のガイダンスをいただければ幸いです。

前もって感謝します!!!
1 年 2024 月 XNUMX 日に匿名で質問

1 年 2024 月 XNUMX 日に匿名からの質問

こんにちは、

問題ありません。ご質問にできる限りお答えいたします。

一般に、Web スクレイピングは Web サイトまたは URL パターンのいずれかに限定されます。それ以外の場合は、 internet がリンクをたどると、Web スクレイピングが終了しなくなります。

スクリーンショット ツールは、スケジュールに従って、または Web ページが変更されたときに、指定された URL のスクリーンショットを 1 回だけ取得します。キャプチャしたい URL のリストがある場合は、これをインポートできます into スクリーンショットツール。

API を使用すると、独自のロジックを使用してスクリーンショットをトリガーできます。したがって、あなたがやっていることには、APIをトリガーする、ある種のカスタムWebスクレイパーが必要になると思います。 

この情報がお役に立てば幸いです。

1 年 2024 月 XNUMX 日に GrabzIt サポートによって回答されました