プログラミングを始めてみた話part2~kaggleとpython~
完全に初心者用の備忘録です。
プログラミングを生業にする人複数名からアドバイスを得て、プログラミングやるなら
・作るものを決める→やりたいことを決める
・それに必要な技術を逆算して習得する
・そのために必要なものをぐぐりまくる
の手順を踏むといいということなので、機械学習を煮詰めて、麻雀AIとFXの売り買い予想マシーンを作ることをゴールにしようと思います。
で、機械学習ならとりあえずpythonとkaggleがいいらしいということで、わけもわからずkaggleやりはじめる。
登録する→使い方わからへん…早速ぐぐる。
kaggleは機械学習コンペサイトらしい。企業からお題が出て、それに対するコードを参加者が提出、上位入賞者のコードは企業に買い取られて賞金が出る。って流れっぽい。
おいおい、そんなレベルの高い事いきなり無理でんがな…と思って再度ググる。
→初心者向けのチュートリアルも充実してるらしい→タイタニックの乗客の生死を予測するチュートリアルで頑張ってみようみたいなサイトがヒット(定番らしい)。
機械学習ってどんなコード書くんだ??
まずはpandasとnumpyをimportする←意味不明・ググる
どうやらライブラリというお徳用関数セットが事前に準備されていて、これらをimportするだけでその関数が定義しなくても使えるようになるらしい。めっちゃ便利やん。
とりあえずpnadasもnumpyも統計やデータ分析に必須ライブラリらしい。よしよしいい調子。 もう一回お手本コードに戻る
import pandas as pd
なんやas pd って。importだけで終わりとちゃうんか→ググる。
asはインポートしたライブラリに自分の好きな名前を付けられるって話。pandasだと長いからpdにしました、短いほうがいいね。numpy はnpと訳されることが多いらしい。
よしいい調子いい調子。次
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(a+b)
[5,7,9]
あかんやってることはなんとなくわかるけどコードの意味が分からへん。.arrayってなんやねん。→ぐぐる。npの中のarrayって関数を使うという意味っぽい。
array関数はなんやねん→ぐぐる。どうやらリストを行列化?してるっぽい。(ということは同じ型の行列じゃないと足せないはずなので3要素と2要素の行列足したらエラー出るのか?←明日試す
全く本題に行きつかないのだが、とりあえず本日ここまで。