上級編第1回目は、DB Nodeについて解説します。ETLツールとしてKNIMEの本当のパワーが発揮できる部分です。
今回でKNIMEの完全自動化を完成させます。スケジュール実行を可能にするタスクスケジューラについて解説します。
今回はKNIMEの実行を自動化していきたいと思います。
今回は、完全自動化に近づくための第一歩、バッチファイルを扱いたいと思います。
今回は、KNIMEで使えるショートカットキーをご紹介します。
中級編の最終回、今回はKNIMEでの相対パス(relative path)について扱います。
自動削除フォルダを作るNode、 Create Temp Dirを解説します。
前回は日付のフォルダを作成しましたが、今回は前回作成したファルダの中に1.ファイル名を指定して2.ファイルパス(フォルダ+ファイル名+拡張子)にして3.実際に書き出す ところまでやりたいと思います。
はてなブログ無料版でGoogle Adsenseに合格しました! 17回落ち続けた経験を元に、合格のために何をすべきかを徹底分析します。
実行日ごとにフォルダを作って、そこにOutputをアーカイブしていくシステムを作っていきたいと思います。 第一回はフォルダを作るNodeを扱っていきます。
今回は、超便利Node、日時情報を抜き出すExtract Date&Time Fieldsを扱っていきます。
日時をベースでフィルタをしたいときに使えるDate&Time-based Row Filterを解説します。今回も日時の扱いを行う上で重要ですね。
pythonのウェブスクレイピングを使ってサイト内にあるPDFを一括でダウンロードする方法を解説します。 情報処理技術者試験の過去問を一気にダウンロードしてみます。
今回は日付計算の肝、Date&Time Shift 日時の足し算引き算を扱います。これができれば、自動化の幅がかなり広がります。
日時から期間を計算するNodeを扱いたいと思います。日時の計算は自動化が難しい分野だと思います。 これを習得すれば日時の計算はかなり楽になるのではないでしょうか!
今回は総当たりでデータを作成する、Cross Joinerを扱いたいと思います。勤怠表の元データを作成したい場合などに便利ですね。
超重要Nodeです!今回は欠損値を処理するNode、"Missing Value"を扱いたいと思います。
Date&Time型を集中的に扱うシリーズを開始します。第一弾は、Date&Time型を作るNodeについてです。
今回は文字数を基準にしてセルを区切っていきたいと思います。固定長区切りのデータを取り込むときに使えます。
超重要Node、Cell Splitterを扱います。セルを分割するNodeで、汚いデータをきれいにしていく作業によく使用します。
今回は、2つのNodeを紹介していきます。一定値を入れることができる、「Constant Value Column」と、値の種類を数えることができる「Value Counter」です。 今回は、値の種類を数える方法を2つご紹介して、2つのNodeの使い方を見ていきます。
今回はラベルを付けるために使用するRule Engineをご紹介します。Rule-based Row FilterでほとんどConfigureの書き方は扱ったので、少し煩雑なルールでご紹介します。
今回はコラムリストを使ってコラムの順番を並び替えていきましょう。ついでに削除の方法もご紹介します。
Column FilterとReference Row Filterが分かっていれば、概念は名前から分かりますよね。他テーブルの情報をもとにメインのテーブルのコラムを削除します。(もしくは分けます)
前回はコラム名(Column Header)を扱いましたが、今回はRowIDを操作してみたいと思います。Row IDはInsert/Extractが分かれていません。1つのNodeでRow IDを取り出したり、RowIDを入れ替えたりできます。
今回はコラム名を一括で入れ込みましょう。これを使えば、コラム名を総入れ替えすることが可能になります!
今回はコラム名を抜き出したいと思います。コラム名を一括で操作したいとき等に使用しますね。
KNIME内だけでテーブルを作りたいなーというときに使えるNodeです。
今回はExcelの貼り付けオプションにある、行/列の入れ替えの自動化です。
特定のデータを抜き出す第5弾、自由にフィルタを行えるRule-based Row Filter/Splitterを扱います。