デジタル推進課

KNIME・Excel Macro・Power Automateなど日々の業務で使用できる自動化ツールを中心に書き綴ります

KNIME - 短期集中プログラム #66daysofdata で実践から学ぶ!

f:id:makkynm:20220123094505p:plain

 

はじめに

こんにちは、自動化大好きまっきーです。みなさん、明けましておめでとうございます!(おそい)

今年もまっきーをよろしくお願いします。さてそろそろNode紹介も飽きてきたので、実践編に移って行こうかなーと思います。ちょうどいい教材を探していたのですが、2021年9月ごろにKNIME公式が発表していた #66daysofdata という短期集中プログラムをやっていけたら面白いかもなーと思い、ひとまず紹介したいと思います。好評であれば続けていきますね!

 

 今回のテーマ ~#66daysofdata~

www.knime.com

 

覚えてほしいこと

力試しに #66daysofdata はどうでしょうか?

 

やりたいこと

#66daysofdata の概要を理解する

 

#66daysofdata とは?

データサイエンスを習得する短期集中プログラム」ですかね!元々はKen Jeeという方が提唱したチャレンジです。

  1. 毎日5~10分使って66日間でデータサイエンスを学ぼうよ!
  2. 進捗をsnsでシェアして、モチベーション高く学ぼう!

という2つのポイントがあります。

これをKNIMEでやってみよう!というのが、今回のチャレンジです。

The idea is to spend around 5-10 minutes on a specific data science project each day for 66 days and share your progress on your favorite social media platform with #66daysofdata. Ken Jee is the original instigator of #66daysofdata. Why 66 days? Because that's the average time it takes us to get practiced at doing something. In this case, data science with KNIME.

Data Exploration in #66DaysOfData with KNIME | KNIME

 

youtu.be

 

KNIMEの場合は?

コンテンツは同じになりますが、KNIMEは下記のようにこのチャレンジをサポートしてます。

  1. 分からなかったらKNIMEのCommunity siteで質問できる!

    Data Exploration in #66daysofdata with KNIME - Community - KNIME Community Forum

  2. SNS(KNIME Hub, Twitter, Linkedlin)に進捗を報告してね!
  3. 全部終わったら、KNIME Hubのリンクをblog@knime.comに送ってくれたら終了記念デジタルバッチをプレゼントするよ!

 

学習ロードマップ

66日間、下記のように進んでいきます。詳しくはKNIMEの公式ガインダンスをご覧ください。

1. Import Data (Day1~Day7) データの取り込み 

データの読み込みを学びます。

 

2. Descriptive Statistics (Day8 ~ Day12) 記述統計

平均を求める、欠損値の処理などを学びます。

 

3. Histograms (Day13 ~ Day18) ヒストグラム

ヒストグラムの作り方について学びます。また、KNIMEのComponentの概念、KNIME Hubへのworkflowのアップロードについても学びます。

 

4. Date Standardization (Day19 ~ Day23) データクレンジング

日付の処理など、データを処理しやすい形に変換させたりします。

 

5. Ungrouping and Aggregations (Day24 ~ Day27) 集計

GroupByやJoinなどを利用して集計を学んでいきます。

 

6. Plots and Charts - Univariate Analysis (Day28 ~ Day35) 単変量解析

グラフ化を行います。

 

7. Plots and Charts - Multivariate Analysis (Day36 ~ Day44) 多変量解析

さまざまな種類のグラフ化を行いながら、変数が2つ以上あった場合の関係性などをみていきます。Loopなどもここで登場します。

 

8. Plots and Charts - Time Plots (Day45 ~ Day51) - 変数・時系列グラフ

変数が登場します。折れ線グラフをしようした時系列グラフなどもここで作ります。

 

9. Plots and Charts - Control - (Day52 ~ Day56) ダッシュボードの作成

Web Serviceを作る第一歩、interactive dashboardの作り方を学びます。

 

10. Covariance and Correlation (Day57 ~ Day61) 共分散と相関係数

静的解析の第一歩、共分散と相関係数について学びます。

 

11. Text Visualization (Day62 ~ Day66) テキスト解析

テキスト解析、文字の見える化について学びます。

 

12. Graph Visualization (Bonus) - 更なるグラフ化

もっとグラフ化について学びたい!という方へのボーナスステージ

 

おわりに

KNIMEの普及のために、KNIME公式ではいろんな活動を行なっているようです。学びたいけどどこから始めてみよう。。と思っている方、このような短期集中プログラムに参加するのもいいのではないでしょうか。ではまた!

 

 

 

KNIME Hubワークスペース

makkynm/Public – KNIME Hub

Twitter アカウント

まっきー | デジタル推進課 (@makkynm) | Twitter

 

KNIMEに関する本

KNIMEに関する日本語の本って今これくらいしかないと思うんですよね、、

本がいいなーと言う人はぜひ試してみてください。

 

参考リンク