2020.3.6
ソニーのホームページによると、「専門家でなくても簡単に操作でき、データを用意すれば、数クリックで高度な予測分析を自動的に実行できるソフト」と説明されています。
サンプルをいじってみると、クリックするだけで、機械学習を始め、数分でモデルができて、予測する日のデータファイルを読み込ませれば数秒で結果が戻ってきます。
本当に簡単!
前回、POSレジと気象データから作った学習用データを使って、来客数の予測をしてみようと思います。
【AD】作成したデータをPrediction Oneに読み込ませて学習から始めます。
予測するターゲットは、「来客数」で、予測する期間は1日から10日先に設定。
学習を始めると処理状況が画面に表示されます。
どのような結果になるか、わくわくします。
機械学習では、学習してモデル作成後に精度の評価を実施します。
用意した学習用データ数は266で、学習に要した時間は1分とちょっとでした。
予想していたよりあっけなく終わってしましました。
学習が終わると、予測精度のレベルが表示されます。
レベルは★★★★(四つ星)で、「モデルの制度はかなり良いです。」とコメントされています。
「誤差率中央値」が「0.1316」になっています。
誤差率中央値とは、誤差率の中央値です。
誤差率は、(機械が算出した推定の来客数)から(実際の来客数)を引いて、その絶対値を(実際の来客数)で割ったものです。
誤差率=(推定値‐実際の値)の絶対値/実際の値
機械学習の分野では、「誤差率中央値」が推定結果の正確さを示す一般的な指標となっていて、この値が小さいほど推定精度が高いことを意味します。
この数値は日々変動します。
学習ができたので、前回作成した予測用のCSVファイルをPrediction Oneに読み込ませて来客数を予測してみます。
予測ファイルに含まれるデータは、予測する日付・曜日、気象庁の1週間天気予報から天気、最高気温・最低気温の数値、祝日のフラッグです。
そして、Prediction Oneにこのファイルを読み込ませます。
これも、瞬時に結果が出ました。
Prediction Oneが予測した水曜日から土曜日の4日間の来客数は、
・水曜日―24.296902人
・木曜日―20.477566人
・金曜日―23.983125人
・土曜日―22.508803人
でした。
これまでの経験から来客数は、
・休日明けが多い
・木曜日が少ない
・雨の日よりも晴れの日が多い
という傾向があります。
Prediction Oneの数値と合致しています。
それでは、実際の来店数は、
・水曜日―33人(+9)
・木曜日―24人(+4)
・金曜日―13人(-10)
・土曜日―29人(+7)
でした。
予測結果に対して実際の来客数は、金曜日を除いて予測した値より大きく、木曜日は少い数値になってしまいました。
週間天気予報のデータを利用しているので、天気予報が違うと予測も影響を受けると考えられるので、実際の天気を使用して再度予測してみました。
結果は、次のとおり。
天気と気温に実際の値を使っているのですが、大きな変化はありません。
正確な予測をするには、天気や気温だけでなく人間の心理状況などを加えたデータを加えるなど検討の必要がありそうです。
機械も人と同じように正確な判断をするには多くの経験と知識が必要なようです。
【AD】