はじめに
KNIMEをインストールし、さあ始めようという方、その前にDatabaseの基礎を理解しておきましょう。KNIMEはDatabase操作のツールです。「Databaseとは」という概念が初めに分かっていると、どのような形式に加工すれば上手く自動化できる・データ処理の後のVisualizationに繋がるかなどが見えてきます。
Databaseとは?
皆さん、データベースとは?と聞かれてなんと答えますか?
Google検索でヒットしたブログから引用すると、
一定の形式で整理されたデータの集まり
だそうです。
もっと単純に説明すると、
データベースとは、表(Table)のこと。行(Row)・列(Column)の要素を持っている表を指します。
Excelでこのボタンが使えるものですね。
社内で業務の自動化を考える際は、 このようなデータベースの形式を持ったデータを使う作業であれば、自動化しやすいと考えるのが良いと思います。
データ型とは?
データ型(データがた、data type)とは、(コンピュータにおける[1])データ(値)の種類に関する分類である。データタイプともいう。
具体的にいうと、たとえば 0, 1, 2, -42 といったような値は整数型であり、"foo", "Hello" といったような値は文字列型である[2]。プログラミングなどにおいて、まずデータオブジェクト[3]や関数[4]などの「値」について、またさらに、それらに関連付け(束縛)される変数や定数[5]、リテラル、それらを組み合わせる演算子、さらにそれらからなる式といった構文上の要素の型が、データ型の議論の対象となる。
私は理解できませんでした。。
私の言葉で説明すると、データ型とは、パソコンがそのデータを(文字、数字、時間etc)として認識したことを示すものです。
下記が代表的な例です。KNIMEでの表示例とともに記載します。"S"と書いてあれば、KNIMEが文字としてそのデータを認識したということになります。
型変換はよく行う処理なので、ここで下記のデータ型は覚えておいてください。
よくある変換
Excelでも電話番号打つとき、勝手に数字に変換されて先頭のゼロ消されたことありませんか?そこで文字列に変更してゼロを表示させます。
同じことをKNIMEでも行います。基本的に計算に使用しないものはすべて文字列に変換するということを覚えておいてください。
おわりに
今回はテーブルとデータ型について触れました。KNIMEを使い始めたころに引っかかる部分なので何回も参照するといいと思います。特に数字と文字列の扱いに苦労するときがあります。
様々なエラーが今後出てくると思いますが、そのエラーによくかかわっているのが、このデータ型です。データを読み込むときや、データを読み込んだ後の型変換を癖として行うとそのあと非常にエラーが少なくなると思います。
ではまた!
余談
すごい座談チックな話なので、つまらないですよね。そんな時に元気が出るおススメ映画は、「ビリギャル」です。正直見る前は、ただ単に有村架純がかわいいだけの映画だと思ってたんですよね。でも見てびっくりなぜか感動。そして泣いてしまった作品です。自分で自分に驚いてました。これ実話をもとに小説から実写化した話なのは有名ですよね。これが実話に基づいた話ということを知りながら見ると、こんな頑張ってなかったな、ちょっとがんばろ!と思えるような作品です。