続き。結論進捗無し。
DQNやりたくて一生懸命コピペしてたが、何一つ上手く動いてくれない。
これが事実1。環境構築?とは難しい。
ネットの記事を見てるとDQNのコードを書いてから遊んでる人が多かった。
事実2。やった訳では無い。
事実3。
機械学習のモデルを作るのは天才にしか出来ないらしい。
(コピペするだけだし大丈夫だろと思ってる)
ーーー
マジで腰重いんだけど、深層+強化なので、片方ずつやって組み合わせれば出来ると思うんだよね。ちな出来ないと詰み。
環境設定だるい→colabええやん→Tensorええやん→keras→rl→2
まで調べて、謎のコードが動きました。耐え。
環境の意味多すぎて嫌だけど、コピペしながら、昔シャドバを機械学習でやってBOT作りたいなと思って、その環境を作るのが難しくて辞めた事を思い出した。
あの時、雑にオセロとかで実装してたら楽出来たのにな。学び得だったわ。学ばない損か?
ーーー
謎コードが動くことが確認できて目標が明確になったので、後は正しい解釈。
環境(IN)
深層
強化
結果(OUT)
の4階建てと睨んでいるので、最短で4日かかりそう。
雑に9倍して、2月の下旬にはそれっぽい物が作れたら嬉しい。
データ取得、もう最悪買えば良いかなと思ってる。動かない物はどうしようもない。
こっちの方が圧倒的に難しいし。使えるようになれば優位性になりそうで嬉しい。
ーーー
次回はライトでポップな記事を読みつつ、もしかすると一番難しい環境かな。
テンプレありそうだし、実は簡単かもしれない。
無理そうならパスして深層。