t - owakusoのブログ

続き。結論進捗無し。

DQNやりたくて一生懸命コピペしてたが、何一つ上手く動いてくれない。

これが事実1。環境構築？とは難しい。

ネットの記事を見てるとDQNのコードを書いてから遊んでる人が多かった。

事実2。やった訳では無い。

事実3。

機械学習のモデルを作るのは天才にしか出来ないらしい。

（コピペするだけだし大丈夫だろと思ってる）

ーーー

マジで腰重いんだけど、深層＋強化なので、片方ずつやって組み合わせれば出来ると思うんだよね。ちな出来ないと詰み。

環境設定だるい→colabええやん→Tensorええやん→keras→rl→2

まで調べて、謎のコードが動きました。耐え。

環境の意味多すぎて嫌だけど、コピペしながら、昔シャドバを機械学習でやってBOT作りたいなと思って、その環境を作るのが難しくて辞めた事を思い出した。

あの時、雑にオセロとかで実装してたら楽出来たのにな。学び得だったわ。学ばない損か？

ーーー

謎コードが動くことが確認できて目標が明確になったので、後は正しい解釈。

環境（IN）

深層

強化

結果（OUT）

の4階建てと睨んでいるので、最短で4日かかりそう。

雑に9倍して、2月の下旬にはそれっぽい物が作れたら嬉しい。

データ取得、もう最悪買えば良いかなと思ってる。動かない物はどうしようもない。

こっちの方が圧倒的に難しいし。使えるようになれば優位性になりそうで嬉しい。

ーーー

次回はライトでポップな記事を読みつつ、もしかすると一番難しい環境かな。

テンプレありそうだし、実は簡単かもしれない。

無理そうならパスして深層。