私たちのブログを読んで、私たちが取り組んでいるものを最新の状態に保ち、新しいものを発見し、 int自分のプロジェクトでGrabzItを使用できる方法を考えてみてください。
ビデオ API への新しい Web ページを作成しました。現在、アルファ テストに利用できます。 それで、これは何をするのでしょうか? 簡単に言うと、スナップショットではなく、一定期間にわたって Web ページをキャプチャし、短いビデオを返すことができます。 これにより、画像の変更やビデオの再生など、Web ページ上の変化を確認できます。
月に数回のキャプチャのみを希望するお客様向けに、新しく小型で安価なパッケージを追加しました。 パッケージのみの料金 $1.99 月
残念ながら、現在のコストでビジネスおよびエンタープライズ パッケージを提供することは持続不可能であることがわかりました。 これらのパッケージは、特に競合他社と比較した場合、非常に寛大です。
昨年、GrabzIt は長期的な将来性とパフォーマンスの向上を確実にするために、コア テクノロジーを更新してきました。 ウェブサイトの大部分は更新されましたが、まだいくつかのページが残っています。
GrabzIt のより高度な機能の XNUMX つは、キャプチャする機能です。 フルレングスのスクリーンショット と同様 ターゲットを絞った HTML 要素。 残念ながら、そのような情報の取得はこれまで不正確であったため、その方法を再検討しました。
当社のサービスに多くの機能を追加してきた当社のソーシャル メディア ページをご覧いただければ、同意していただけると思います。 実際、HTML から DOCX、スクリーンショット ツールの Web アーカイブ、より優れた速度、信頼性、カスタマイズ オプションに至るまでロードされます。
しかし、注意深く分析した結果、弊社が大型パッケージに対して提供する割引価格は持続可能ではないことに気づきました。 主にサーバーコストの観点からです。 たとえば、Enterprise パッケージは Entry パッケージよりも 100 倍多くのキャプチャを取得できますが、コストはわずか 9 倍です。
ほとんどの場合、Web サイトに最新の情報を表示することが重要ですが、Web サイトやオンライン コンテンツのアーカイブ バージョンを保持することも同様に重要な場合があります。 これは Web サイトのバックアップではないことを認識することが重要です。
検索エンジン最適化 (SEO) は、Web 検索エンジンのユーザーに対する Web サイトまたは Web ページの可視性を高めることによって、Web サイトのトラフィックの質と量を増やすプロセスです。 ただし、最適化の効果を確認するには、変更の効果を測定できる必要があります。
多くの場合、アプリではドキュメントを動的に作成する必要があります。 これを行う XNUMX つの方法は、Microsoft Office などの専門ライブラリを使用することです。 IntWord を erop して文書を部分ごとに構築します。
残念ながら、このようなライブラリを使用すると、ドキュメントのコンテンツがその作成に使用されたライブラリに関連付けられることになります。 ドキュメントの作成に使用されるほとんどのライブラリではコンテンツをエンコードする必要があるため into そのライブラリに固有のオブジェクト構造。
ブログや Web サイトなどのオンライン コンテンツを数日または数週間かけて作成し、それが誰かに盗まれて Web サイトに掲載されることを想像してください。
これは不公平であるだけでなく、違法です。 ほとんどすべての国では、多くの場合、著作権が作成されるとすぐに著作権保護が提供されます。 残念ながら、Web ページに著作権マークを配置するだけでは役に立ちません。
再設計と大量のバグ修正に加えて、GrabzIt の Web スクレイパーに次のような大幅な改善を加えました。
PDF 内の HTML 要素のターゲットを最近アップグレードする前は、結果として得られる PDF ページ サイズは、ターゲットの HTML 要素と同じでした。 これは、HTML 要素以外のすべてを切り取る以外に、PDF からターゲットのみを抽出する信頼できる方法が見つからなかったためです。
当社の Web スクレイパーは非常に強力なツールですが、技術者以外のユーザーにとっては使用が難しい場合があります。 2016 年のこのハウツービデオでわかるように。
この問題を解決するために、明示的に要求されない限り生のスクレイピング命令を非表示にし、「スクレイピング命令」タブにデフォルトで平易な英語でスクレイピング命令が表示されるようになりました。 実際、スクレイピング命令は、コードを一切書かずに完全に追加および削除できるようになりました。
ご存知かと思いますが、私たちは数週間前にアンケートを送信し、キャプチャを Amazon S3 に自動的にアップロードする機能が必要かどうかを尋ねました。圧倒的にそう思うという回答が返されました。
これが私たちが行ったことです。すべてのクライアント ライブラリは間もなく、Amazon S3、Dropbox、FTP、WebDav へのキャプチャの自動アップロードをサポートする予定です。 これを行うには、API に渡すことができるエクスポート URL を作成する必要があります。
しかし、その途中でさらにいくつかの機能を追加することにしました。
過去 XNUMX つのリリースに引き続き注目です。 DOCX サービスへの新しい HTML と URL、およびキャプチャ ソフトウェアの更新バージョン。ブラウザのベース コードが更新され、レンダリング品質を向上させるための修正が加えられています。
しばらくの間、GrabzIt についてあまり聞いていないかもしれませんが、それは私たちが忙しかったからではありません…私たちは過去 XNUMX か月間、あなたのために新しい HTML から DOCX への変換サービスを作成するために頑張ってきました。早めの様子。
今後数週間のうちに、HTML 要素を非表示にすることができる API のアップデートのロールアウトを開始する予定です。 これは、一部の Web サイトがユーザーにアクションの実行を促すために使用される迷惑なインライン モーダル ポップアップを非表示にする場合に特に役立ちます。
2016 年は GrabzIt にとって重要な年でした。ここで私たちの主要な成果のいくつかをまとめます。
GrabzIt の API は、直接 HTML 変換をサポートするようになりました。 これは、HTML を記述して GrabzIt に渡すと変換されることを意味します。 int画像またはPDF。 GrabzIt が読み取れる HTML ページを作成する必要はありません。 ただし、CSS や画像などのリソースはページに埋め込むか、一般にアクセスできるようにする必要があります。
当社の Web ページから PDF へのサービスは、Web キャプチャ テクノロジーを WebKit から Chromium ベース コードに切り替えることで大幅に品質が向上しています。 これは、XNUMX か月ほど前に行われた画像スクリーンショット サービスの同様のアップグレードに続くものです。
画像スクリーンショット テクノロジーを WebKit ベース コードの使用から Chromium に移行しています。 これは複雑な作業でしたが、結果に満足していただけると信じています。
場合によっては、Web ページのスクリーンショットを撮るだけでなく、ブラウザー ウィンドウでスクリーンショット画像をラップする必要がある場合があります。 したがって、ユーザーは自分のブラウザ ウィンドウからスクリーンショットがどのように表示されるかを確認できます。
Web スクレイピングは、通常は構造化されていないデータ ソースから情報を抽出するために使用されます。 IntHTML や PDF ドキュメントなどの ernet。
URL のスクリーンショットを取得する最も簡単な方法は、GrabzIt の オンラインスクリーンショットツール, まず新しいタスクを作成し、スクリーンショットを撮りたい Web サイトの URL を入力し、特別なオプションを指定すると、指定した方法で URL スクリーンショットが返されます。
私たちは最近、サービスの一連の改善を完了し、できるだけ早く作成できるようにしました。 ウェブページのスクリーンショット、スクレイピングを実行するか、アニメーション GIF などを作成します。
まず最初に、ハードウェアを分析し、スクリーンショットの生成時間を大幅に短縮するいくつかの変更を加えました。