KNIME - 中級編
今回は文字数を基準にしてセルを区切っていきたいと思います。固定長区切りのデータを取り込むときに使えます。
超重要Node、Cell Splitterを扱います。セルを分割するNodeで、汚いデータをきれいにしていく作業によく使用します。
今回は、2つのNodeを紹介していきます。一定値を入れることができる、「Constant Value Column」と、値の種類を数えることができる「Value Counter」です。 今回は、値の種類を数える方法を2つご紹介して、2つのNodeの使い方を見ていきます。
今回はラベルを付けるために使用するRule Engineをご紹介します。Rule-based Row FilterでほとんどConfigureの書き方は扱ったので、少し煩雑なルールでご紹介します。
今回はコラムリストを使ってコラムの順番を並び替えていきましょう。ついでに削除の方法もご紹介します。
Column FilterとReference Row Filterが分かっていれば、概念は名前から分かりますよね。他テーブルの情報をもとにメインのテーブルのコラムを削除します。(もしくは分けます)
前回はコラム名(Column Header)を扱いましたが、今回はRowIDを操作してみたいと思います。Row IDはInsert/Extractが分かれていません。1つのNodeでRow IDを取り出したり、RowIDを入れ替えたりできます。
今回はコラム名を一括で入れ込みましょう。これを使えば、コラム名を総入れ替えすることが可能になります!
今回はコラム名を抜き出したいと思います。コラム名を一括で操作したいとき等に使用しますね。
KNIME内だけでテーブルを作りたいなーというときに使えるNodeです。
今回はExcelの貼り付けオプションにある、行/列の入れ替えの自動化です。
特定のデータを抜き出す第5弾、自由にフィルタを行えるRule-based Row Filter/Splitterを扱います。
特定のデータを抜き出す第4弾、他テーブル参照式Row フィルタです。 他のテーブルに含まれている値を基準に、フィルタを適用することができるようになります。
頻出Node、Duplicated Row FIilterを紹介していきます。使える場面多めだと思います。Excelでも重複チェック機能や重複削除機能はありますよね。
さて、今回は特定のデータを抜き出す第2弾です。値選択式の行フィルタ、Nominal Value Row Filter / Splitterを解説します。使用頻度は高めです。
ファイルの読み込みで一番Basicかつ多機能なFile Readerです。
今回はCSVファイルを書き出します。
今回はCSVファイルを読み込んでみたいと思います。
変数の次はLoopです。こちらもかなり大事な内容だと思います。 習得すればさらに幅が広がります。特にファイルの読み込みに力を発揮するので、ファイルの読み込み方を習得してしまいましょう。
中級編の第1回目は変数です。変数を使って、ファイル名を日付にしてみましょう。また、その他の変数活用法まで説明します。