日別売上の予測っぽい事に再チャレンジ。直近7日で8日目予測とか。／Neural Network Console

今回は「日別売上の予測」という一度失敗している課題に再チャレンジしています。

今回は直近7日で8日目を予測・・に頭を切り替えてやってみました。

f:id:arakan_no_boku:20190326212937j:plain

日別売上の予測っぽい事に再チャレンジ

前回は恥ずかしながら、うまくいきませんでした。

arakan-pgm-ai.hatenablog.com

問題は、入力のXから生成されたX'をつかって、AutoEncoder的に生成したものが、なんとなくうまく行ったように見えたので、調子にのったことです(;^_^A。

まあ、冷静に考えると。

最終的に結果(y)を推論しないで「予測らしきこと」をしようという発想には無理がありすぎましたね。

Googleグループでも同じ話題がコメントされてました。

groups.google.com

まあ・・、「こうしたらダメだよ」というのも情報ですから（笑）

開き直って、やってみます。

LSTMでやろうとしてみました

上記のGoogleグループでのコメント等を参考にするならば、7日分の売上データがデータ（x)で、次の7日分の売上を結果(y）するアプローチが必要です。

仮に、7日間の売上を７列１行の1週間分1ファイルで、0.csv、.1.csv・・のように作ったとしたら、イメージとしてはこんな感じ。

x:data,y:label

.\0.csv,./1.csv

これを学習させて、最終週の７日分（x）のみ与えて、次週を予測させる。

こんな感じになるはずで、実際にこれをやるとしたら、学習データは、7日分（x_0~x_6）を収めたCSV(x）に対して、結果(y）の次の7日分をｙ＿＿0～y__6に展開するようなことになるはずです。 f:id:arakan_no_boku:20180404092817j:plain

このやり方はこちらのチュートリアルでも紹介されてますので、まあ、あってはいるでしょう。

support.dl.sony.com

なかなかしっくり来なかったです

上記のデータセットを使ってやってはみました。

ただ、結果はダメダメです。

用意できた学習データの量がせいぜい1年分（52週）程度では少なすぎます。

LSTMなんかは、もっと複雑で巨大なデータに適したモデルみたいなので、まあ、フェラーリで学校の100Mトラックを走ってるみたいな感じでしょうか（笑）

ということで。

LSTMは、すっぱり忘れましょう。

こちらのスライドの31ページ目にも書いてありますしね。

2018/02/27 Recurrent Neural Networks starting with Neural Network Console from Sony Network Communications Inc.

www.slideshare.net

このCNNを、普通の浅いAffineモデルに読み替えてやってみましょう。

直近７日間の数値で翌日を予測するアプローチ

アイディアはこうです。

７日間の時系列データで、７日分の予測をするのではなく、1日ずつずらしながら、直近７日分の数値を一塊のデータとして、８日目の数値を予測する。

こうすれば、同じ期間の数値（例えば売上等）でも学習用データの量としては７倍にできますし、なにより、時系列で処理する必要がないので、普通のニューラルネットワークで対処できそうです。

新しいアイディアに沿ってデータを修正

使い方１８の時同様に、日別の数値（売上？）を用意して、1.0～-1.0の範囲になるように100000で割って少数以下の数字にします（C列）。

f:id:arakan_no_boku:20180403225849j:plain

これを、7日間をx__0～x__6のデータとして、8日目をyとする以下の1行8列のデータにして以下のようなCSVデータを作ります。

f:id:arakan_no_boku:20180403230913j:plain

このやり方はNNCのチュートリアルのこの記事を参考にしています。

support.dl.sony.com

例によってCSVデータを生成するEXCEL－VBAプログラム

今回は、これで約５ヶ月分（約１５０行くらい）を学習用、同じフォーマットで最後の１週間分（７行）を評価用として２つのファイルを作りました。

手で作ると大変なので、こんな感じでEXCELのVBAでCSVデータを作って、あとで学習用と評価用にわけました。

ちなみに、ソースコード中の「forward01」は、シート名ですので、適宜書き換えてください。

Sub dataCreate3()
     Dim wkst
     Dim obj As Object
     Dim buf  As Variant
     wkst = "forward01"
     bottom = Range("C2").End(xlDown).Row
     ts = 7
     fn = 0
     Set obj = CreateObject("ADODB.Stream")
     obj.Charset = "UTF-8"
     obj.Open
     datFile = ActiveWorkbook.Path & "\" & wkst & ".csv"
     out = ""
     out = "x,x__1,x__2,x__3,x__4,x__5,x__6,y" & vbNewLine
     obj.WriteText (out)

     For r = 1 To bottom - 1
        If (r + 8) < (bottom - 1) Then
           out = ""
           out = out & Worksheets(wkst).Cells(r + 1, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 2, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 3, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 4, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 5, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 6, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 7, 3).Value & ","
           out = out & Worksheets(wkst).Cells(r + 8, 3).Value & vbNewLine
           obj.WriteText (out)
           fn = fn + 1
         End If
       Next
       obj.Position = 0
       obj.Type = adTypeBinary
       obj.Position = 3
       buf = obj.read
       obj.Position = 0
       obj.write buf
       obj.SetEOS
       obj.SaveToFile datFile, 2
       obj.Close
End Sub

ネットワークモデル

ニューラルネットワークコンソールを立ち上げて、EDITタブでモデルを組みます。

今回学習に使ったモデルです。

f:id:arakan_no_boku:20180404001822j:plain

Input

inputは、x__0～x__6の７列＋結果ラベル（y）の１行８列なのですが、チュートリアルにあるとおり、x__0～x__6の部分だけ・・つまり、7をサイズにします。

f:id:arakan_no_boku:20180404002129j:plain

他のレイヤーの設定

AffineとTanhのあたりはoutshapeを7にあわせる以外は特別なことはありません。

回帰問題なので、最後はsquarederrorにします。

T.Dataset（アウトプット）は「y」です。

f:id:arakan_no_boku:20180404002603j:plain

学習の実行

これで、DATASETに、さきほど用意したCSVファイルを指定して、学習させます。

学習のグラフはこんな感じ。

f:id:arakan_no_boku:20180404093600j:plain

わりと最初の方は、かなり「暴れる」感じのグラフになるんですが、５０epochあたりから収束してきました。

グラフだと100epochもあれば十分なようにも見えるのですが、今回、自分で試行錯誤した結果から言えば上記のように300epochくらいが最良でした。

バッチサイズもいろいろ試しましたが、ちょっと時間がかかりましたが、一番結果がよかったのは「1」でした。

f:id:arakan_no_boku:20180404094628j:plain

評価の考え方

今回、用意した数値（いちおう、売上想定で1週間の曜日で凸凹をつけて、全体的には上昇トレンドを意識して作ったもの）は使い方１８で使ったものの流用です。

ただし、期間をのばして約５ヶ月分の日別にしました。

グラフに描くと、全体としてはこういう見てくれです。

f:id:arakan_no_boku:20180404095618j:plain

あ・・、データは小数点以下なんですが、グラフにするときには100000倍にして、元の整数部5桁の数字にもどしてますので、念のため。

このうちの最後の方だけを拡大してみると、作成したデータはちょうど頂点あたりで終わってます。

f:id:arakan_no_boku:20180404095701j:plain

この続きを予測して継ぎ足してみて、不自然でない数字が予測されていれば、一旦はOKと判断できるんじゃないかと思ってます。

評価結果を加工しながら順次評価

さて、評価を実行した結果です。

プロジェクト名.filesフォルダの実行日付_時刻フォルダ（20180404_130520等）の下「output_result.csv」を開きます。

そうすると右端に「y'」の列があるので、その数値を結果としてコピーします。

実際には、その行のx__1～x__6を、x__0～x__5にずらして、結果のy'をx__6にして、また評価して・・みたいに地道にやる必要があったりします。

これはかなり面倒くさいので、今回のようにお試しでないなら、nnablaとかでプログラム組んだ方がよいとは思いますが・・とりあえず、今回はやってみました。

結果を確認する

結果のグラフです。

f:id:arakan_no_boku:20180412202353j:plain

赤枠で囲った部分が、予測によって生成された数字です。

上昇トレンドも含めて、かなり、正確に予測できているような気はしますね。

しかも、今回はちゃんと推論した結果(y')を使ってますし。

一応、「予測っぽい」くらいのことはできてるんじゃないですかね。

ではでは。

SE_BOKUのまとめノート的ブログ

SE_BOKUが知ってること・勉強したこと・考えたことetc