t

続き。結論進捗無し。

 

DQNやりたくて一生懸命コピペしてたが、何一つ上手く動いてくれない。

これが事実1。環境構築?とは難しい。

 

ネットの記事を見てるとDQNのコードを書いてから遊んでる人が多かった。

事実2。やった訳では無い。

 

事実3。

機械学習のモデルを作るのは天才にしか出来ないらしい。

(コピペするだけだし大丈夫だろと思ってる)

 

ーーー

マジで腰重いんだけど、深層+強化なので、片方ずつやって組み合わせれば出来ると思うんだよね。ちな出来ないと詰み。

 

環境設定だるい→colabええやん→Tensorええやん→keras→rl→2

まで調べて、謎のコードが動きました。耐え。

 

環境の意味多すぎて嫌だけど、コピペしながら、昔シャドバを機械学習でやってBOT作りたいなと思って、その環境を作るのが難しくて辞めた事を思い出した。

あの時、雑にオセロとかで実装してたら楽出来たのにな。学び得だったわ。学ばない損か?

 

ーーー

謎コードが動くことが確認できて目標が明確になったので、後は正しい解釈。

環境(IN)

深層

強化

結果(OUT)

の4階建てと睨んでいるので、最短で4日かかりそう。

雑に9倍して、2月の下旬にはそれっぽい物が作れたら嬉しい。

 

データ取得、もう最悪買えば良いかなと思ってる。動かない物はどうしようもない。

こっちの方が圧倒的に難しいし。使えるようになれば優位性になりそうで嬉しい。

 

ーーー

次回はライトでポップな記事を読みつつ、もしかすると一番難しい環境かな。

テンプレありそうだし、実は簡単かもしれない。

無理そうならパスして深層。