Webをキャプチャして変換するツール

データセットを埋め込む方法

時々 データセットの構築 Webスクレーパー より多くの値が追加されます into別の列よりも1つの列。 以下の例では、最初のページがスクレイプされた後、名前Johnが3つの色とともに名前列に追加され、次のページでは名前Davidが別の2色とともに追加されます。 次のデータセットを提供します。

お名前
ジョン
デイビッド

ただし、この表は、どの名前がどの色で見つかったかを示していないため、誤解を招きます。 代わりに pad メソッドを使用すると、すべての列の長さが同じになるまで、空のセルをデータセット列の最後に自動的に追加できます。 の例 pad 使用されている方法を以下に示します。

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

これらのスクレイプ命令は、次のようなデータセットを生成します。

お名前
ジョン
デイビッド

これをさらに改善するには、 padValue のパラメータ pad メソッドは、スクレーパーによって検出された名前になります。 この例のように、ページごとに名前が1つしかありませんが、スクレイプの指示になります。

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

以下に示すように、名前列のすべての空のセルに名前を入力します。

お名前
ジョン
ジョン
ジョン
デイビッド
デイビッド