- はじめに
- 覚えてほしいこと
- やりたいこと
- #66daysofdata とは?
- 学習ロードマップ
- 1. Import Data (Day1~Day7) データの取り込み
- 2. Descriptive Statistics (Day8 ~ Day12) 記述統計
- 3. Histograms (Day13 ~ Day18) ヒストグラム
- 4. Date Standardization (Day19 ~ Day23) データクレンジング
- 5. Ungrouping and Aggregations (Day24 ~ Day27) 集計
- 6. Plots and Charts - Univariate Analysis (Day28 ~ Day35) 単変量解析
- 7. Plots and Charts - Multivariate Analysis (Day36 ~ Day44) 多変量解析
- 8. Plots and Charts - Time Plots (Day45 ~ Day51) - 変数・時系列グラフ
- 9. Plots and Charts - Control - (Day52 ~ Day56) ダッシュボードの作成
- 10. Covariance and Correlation (Day57 ~ Day61) 共分散と相関係数
- 11. Text Visualization (Day62 ~ Day66) テキスト解析
- 12. Graph Visualization (Bonus) - 更なるグラフ化
- おわりに
- KNIMEに関する本
- 参考リンク
はじめに
こんにちは、自動化大好きまっきーです。みなさん、明けましておめでとうございます!(おそい)
今年もまっきーをよろしくお願いします。さてそろそろNode紹介も飽きてきたので、実践編に移って行こうかなーと思います。ちょうどいい教材を探していたのですが、2021年9月ごろにKNIME公式が発表していた #66daysofdata という短期集中プログラムをやっていけたら面白いかもなーと思い、ひとまず紹介したいと思います。好評であれば続けていきますね!
今回のテーマ ~#66daysofdata~
覚えてほしいこと
力試しに #66daysofdata はどうでしょうか?
やりたいこと
#66daysofdata の概要を理解する
#66daysofdata とは?
「データサイエンスを習得する短期集中プログラム」ですかね!元々はKen Jeeという方が提唱したチャレンジです。
- 毎日5~10分使って66日間でデータサイエンスを学ぼうよ!
- 進捗をsnsでシェアして、モチベーション高く学ぼう!
という2つのポイントがあります。
これをKNIMEでやってみよう!というのが、今回のチャレンジです。
The idea is to spend around 5-10 minutes on a specific data science project each day for 66 days and share your progress on your favorite social media platform with #66daysofdata. Ken Jee is the original instigator of #66daysofdata. Why 66 days? Because that's the average time it takes us to get practiced at doing something. In this case, data science with KNIME.
Data Exploration in #66DaysOfData with KNIME | KNIME
KNIMEの場合は?
コンテンツは同じになりますが、KNIMEは下記のようにこのチャレンジをサポートしてます。
- 分からなかったらKNIMEのCommunity siteで質問できる!
Data Exploration in #66daysofdata with KNIME - Community - KNIME Community Forum
- SNS(KNIME Hub, Twitter, Linkedlin)に進捗を報告してね!
- 全部終わったら、KNIME Hubのリンクをblog@knime.comに送ってくれたら終了記念デジタルバッチをプレゼントするよ!
学習ロードマップ
66日間、下記のように進んでいきます。詳しくはKNIMEの公式ガインダンスをご覧ください。
1. Import Data (Day1~Day7) データの取り込み
データの読み込みを学びます。
2. Descriptive Statistics (Day8 ~ Day12) 記述統計
平均を求める、欠損値の処理などを学びます。
3. Histograms (Day13 ~ Day18) ヒストグラム
ヒストグラムの作り方について学びます。また、KNIMEのComponentの概念、KNIME Hubへのworkflowのアップロードについても学びます。
4. Date Standardization (Day19 ~ Day23) データクレンジング
日付の処理など、データを処理しやすい形に変換させたりします。
5. Ungrouping and Aggregations (Day24 ~ Day27) 集計
GroupByやJoinなどを利用して集計を学んでいきます。
6. Plots and Charts - Univariate Analysis (Day28 ~ Day35) 単変量解析
グラフ化を行います。
7. Plots and Charts - Multivariate Analysis (Day36 ~ Day44) 多変量解析
さまざまな種類のグラフ化を行いながら、変数が2つ以上あった場合の関係性などをみていきます。Loopなどもここで登場します。
8. Plots and Charts - Time Plots (Day45 ~ Day51) - 変数・時系列グラフ
変数が登場します。折れ線グラフをしようした時系列グラフなどもここで作ります。
9. Plots and Charts - Control - (Day52 ~ Day56) ダッシュボードの作成
Web Serviceを作る第一歩、interactive dashboardの作り方を学びます。
10. Covariance and Correlation (Day57 ~ Day61) 共分散と相関係数
静的解析の第一歩、共分散と相関係数について学びます。
11. Text Visualization (Day62 ~ Day66) テキスト解析
テキスト解析、文字の見える化について学びます。
12. Graph Visualization (Bonus) - 更なるグラフ化
もっとグラフ化について学びたい!という方へのボーナスステージ
おわりに
KNIMEの普及のために、KNIME公式ではいろんな活動を行なっているようです。学びたいけどどこから始めてみよう。。と思っている方、このような短期集中プログラムに参加するのもいいのではないでしょうか。ではまた!
KNIME Hubワークスペース
Twitter アカウント
まっきー | デジタル推進課 (@makkynm) | Twitter
KNIMEに関する本
KNIMEに関する日本語の本って今これくらいしかないと思うんですよね、、
本がいいなーと言う人はぜひ試してみてください。