時々 データセットの構築 セクションに Webスクレーパー より多くの値が追加されます into別の列よりも1つの列。 以下の例では、最初のページがスクレイプされた後、名前Johnが3つの色とともに名前列に追加され、次のページでは名前Davidが別の2色とともに追加されます。 次のデータセットを提供します。
お名前 | Color |
---|---|
John Redfern | イエロー |
デイビッド | レッド |
グリーン | |
青 | |
パープル |
ただし、この表は、どの名前がどの色で見つかったかを示していないため、誤解を招きます。 代わりに pad
メソッドを使用すると、すべての列の長さが同じになるまで、空のセルをデータセット列の最後に自動的に追加できます。 の例 pad
使用されている方法を以下に示します。
Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color'); Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color'); Data.pad();
これらのスクレイプ命令は、次のようなデータセットを生成します。
お名前 | Color |
---|---|
John Redfern | イエロー |
レッド | |
グリーン | |
デイビッド | 青 |
パープル |
これをさらに改善するには、 padValue
のパラメータ pad
メソッドは、スクレーパーによって検出された名前になります。 この例のように、ページごとに名前が1つしかありませんが、スクレイプの指示になります。
var name = Page.getTagValue({"class":{"equals":"Name"}}); Data.save(name, 'Name', 'Color'); Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color'); Data.pad(name);
以下に示すように、名前列のすべての空のセルに名前を入力します。
お名前 | Color |
---|---|
John Redfern | イエロー |
John Redfern | レッド |
John Redfern | グリーン |
デイビッド | 青 |
デイビッド | パープル |