続き
このそれっぽい図を見ろ!
という事で、参考サイトのコードを全部写す所まで終わりました。
これが何を表しているのか、下の文字が潰れすぎなのは何故か等、全く分かっていません。
現状の問題点は
・欠損だらけのデータ
・次元が揃ってないデータ
・まともな計算処理
て感じかな。特に欠損がヤヴァい。
なんでこの方法で欠損出るんだよと。提出してないのか企業?
次元はどうすりゃいいんだろう。手が止まってる。
今ここで下手に補完すると次の入力で詰まりそう・・・など。
つまり、データ更新のスキームが必要。次はここかな。
計算が分からないのは関数調べてないだけなので、まぁ今調べようか。
・・・とりあえず内容は分かった。
式の話なのか妥当性の話なのか書かないと意味不明の文章になるけど、俺がわかれば良いという事で終わり。
ーーー
pandasが一番凄い奴かは知らんけど、よっぽどの事がない限り今年はこれで行こう。
読み込み→CSV出力→dfに変換
で一応整った気がする。
決算データが欠損しがち。
普段っぽい銘柄選択に寄せるなら最低限欲しいデータだから云々。
いやー面倒くさいな。
次回は
・更新システム
・オリジナルの何か
のいずれか。
更新のほうが大事だよな。どうせ1行付け足すだけだし簡単だろ。
問題は更新するべきデータが複数あったり、それが何か分からなかったりする所。
まぁ終値は絶対要るから、明日の目標はこれだな。
ーーー
去年困った所、確か多次元データの保存方法だった。
今回の手法だと、2次元データを沢山集めておいて、解析の時に新しいデータを作る感じ。
どっちのほうが優れてるか、評価方法すら分からん。
複雑な事を悩まなくて良いし、とにかく時系列の2次元データをストックするのが簡単そうかな?
コーディングを上達するのは頑張れば出来るけど、データ収集の待ち時間は解消方法が無いから、全情報を集める方を優先した方が良いか。
プログラミングの挫折あるあるを踏まないように歩きたい所。
とりあえず1行で一回行動、コメントつけまくりを心がけてる。
他にやることは、元のコードがスマート(難解)なので出来れば書き直したい。
横展開が出来ない。
メンテ性は、動いてる内は良いだろの精神。