2017-07-17〜07-23 やったことと振り返り

体調が安定しない。

公式アプリでブログ更新中(続

編集を見た目モードからmarkdownに変更したけど、反映されてない?

追記

repositoryとgistの整理

repositoryに写したきーた記事のうち不要なものを削除している。量が多いのとgist連携していたのでゴミが溜まっている。

もともとgistに存在していたゴミの整理と、きーたでは表せないことをgistにipynbを使っていたので自動ではなく完全手動。

さらに、markdownのsyntax hilightされていないことに気づき、それも直している。

z検定

分散が既知の場合の検定。pythonとRでやった。

 

  • 数式をsympyで書き代入

  • scipyとRには一発で求める関数が存在しなかったので分布系関数を使って算出

  • statsmodelsには存在していたので、それを使って算出

 

いずれも一つのipynbで完結させ、Rはr2pyを使った。開発が継続されているようで安心したのと、magic commandからpythonの変数を渡せ、返すこともできる。ただし結果がベクトルで帰ってくるので、ndarrayから抽出するのが面倒。

集合知プログラミング

久しぶりに読んだ。本当は決定木から読むつもりだったのだが、途中になっているのが気持ち悪かったので以前の部分を確かめた。決定木の部分を読む理由は業務で使うため。ただし予測ではなく説明用、これホントどうなんだろ…。

 

以前は2章まで終わっていたらしく、3章の階層クラスタリングの途中から始めた。

numpy使わずにやっているので正直辛いけど、使うように改変すると理解が深まる。scipyの距離関数調べたりしながら知識が溜まっている。

 

numpy.apply_long_axis

結果の一つ一つlenを持たないとダメだったりするので、pandas.Series.applyと比較すると面倒

 

scipy.spatial.dist

距離行列ではなく、最低限の要素しか返さない

まとめ

引き継ぎちょこちょこやる