はじめに
さて、今回は特定のデータを抜き出す第2弾です。値選択式の行フィルタ、Nominal Value Row Filter / Splitterを解説します。使用頻度は高めです。
今回のテーマ ~Nominal Value Row Filter / Splitter~
覚えてほしいこと
値を2、3個程度複数選択したいときはNominal Value Row Filter
やりたいこと
出身地が東京都か神奈川県のグループとそれ以外のグループで常に分けたいとします。
Nominal Value Row Filter/Splitterの使い方
今回はNominal Value Row Splitterの画面で説明します。(設定は同じです。FilterとSplitterの違いは特定のデータを抜き出す1を参考ください)
通常のRow FilterやSplitterだと複数の値を指定したい場合、複数のNodeを組み合わせるか、正規表現・ワイルドカードを使用しないとできません。このように、値を2、3個複数選択してグループ分けしたい場合に使用するのが、Nominal Value Row Filter/Splitterです。
Workflow
Workflowは下記からダウンロードできます。
Confirm - Before After
Configure
設定を見ていただきましょう。非常に簡単だと思います。
Step1 - Columnの選択
まず最初にコラムを選択します。今回は出身地を基準にしたいので、「出身」を選択しました。
Step2 - Valueの選択
次に緑色の枠に、抜き出したい値を選択して入れていきます。今回はSplitterなので、緑色の枠に入っている方が上のOutputに出てきます。
Enforce inclusion / exclusion
以前から出てくる、Enforce inclusion / exclusionです。Enforce inclusionにすると、東京都と神奈川県が固定され、データの内容が変わり、新たに「千葉県」のような値が出てきても、exclusionに自動的に流れていきます。
incl. Missing Values
欠損値があった場合の対応です。チェックを入れると欠損値は緑色の枠に移ります。デフォルトは赤枠に行きます。
ちょっと一言
Nominal Value Row Filter とSplitterのConfigureの違い
Row FilterとSplitterで設定は変わず、除かれるテーブルを出力するかどうかだということを触れました。一応実際の設定画面の違いも見てみましょう。
よくよく見ると説明文が少し変わってますね。Splitterは、TopとBottom、FilterはIncludeとExcludeになっています。
おわりに
今回は簡単でしたよね。知っておくだけで使いたいときにすっと出てくると思うので目を通すだけでもいいかもしれません。
在宅勤務4か月目に突入です。もうオフィスに行かなくてもいいのでは、、?
第2波に備えながらも、体動かして健康に過ごしたいものです
ではまたー
余談
選んで抜き出してしまうようなおススメ映画、「万引き家族」です。貧乏な家庭のため、万引きしか教えられるものがない。という状況の中、本当の家族とは?と問いかけてくるような、メッセージ性の強い映画です。あと松岡茉優がかわいくて好きです。家族っていいなとしんみり思いたいときにぜひ。
参考リンク
-
すさんのBlog:
【KNIME】ノード紹介:Nominal Value Row Filter 〜欲しいカテゴリのrowを抽出したい〜 - 非プログラマーのためのインフォマティクス入門。(仮)
- KNIME公式Node Pit(英語):
- KNIME Example Workflow(英語):