2017-07-24〜07-30 やったことと振り返り

体調よくなってきた。githubの草と記憶を頼りに書く。

repositoryの内容整理

最近、ほとんどこれしかしてない。

table of contents(toc)直した

めちゃくちゃだったので直した。ipython notebookでは先頭のh1見出しが記事名になる。加えてファイル名と同じにしないといけないconfigにしてある(とりあえず)ので合わせた。tocは treeとして表示でき、深さを1、つまりh1を対象にしている。

code blocksを直した

sphinxにおけるcode blocksのsyntax highlightはpygmentsによって実現されている。これのwarningによると、literalはダメらしいのでそれを直していた。特にきーたの記事が対象になっていた。

  • python literal
    • 直す or comment out
  • bash literal
    • 直す or shell-session に変更
  • そもそもzshがない
  • など

footerにGoogle Analytics仕込んだ

けど、ダメだった。CSPのせいでgithub以外ダメなことを思い出した。

https://github.com/ksomemo/ksomemo.github.io/blob/19a85cc3a0523f2a030f2143de66616f7d54b12c/docs/contents/qiita/ipython%EF%BC%8Fjupyter%20tips.md#nbviewer用のbookmarklet

Github pagesの方はダメだったけど、sourceに対するtrafficは下記で見れる。

https://github.com/ksomemo/ksomemo.github.io/graphs/traffic

独自ドメインと紐付ければいいのだろうか。ちょっとめんどう。

課題

  • tocに全ての記事が羅列されているので、整理したい
  • 上記の理由はきーた, notebooksという単位でdirectory分けされているので、意味ある単位に分けたい。特にきーた

BigQuery触った

仕事のための勉強として、仕事中にprivateアカウントで触った。BigQueryというよりは、GCP初なのでそこもきちんと理解しておかないとまずそう。

覚えたもの

  • MySQL/Postgresql相当のmanaged DBがあること
  • Project - BigQuery - Dataset - table という構図
  • BigQuery
    • console
    • 料金体系をざっくりと
    • datasetとtable作成
    • query
      • save
      • save as view
      • into table
      • into drive

覚えるもの

  • 各種サービス名と名前
    • EC2相当
    • S3相当
    • etc.
  • BigQuery
    • Standard Query
    • etc.

集合知プログラミング

クラスタリング放置してgithub pages整理していたので時間録れず、巻末のアルゴリズムと数式読みをしていた。 アルゴリズムについてはざっと読んだ。 数式については具体的なsource codeまで書かれていので、一部実装した。

tanimoto係数

2つのデータに対し、それぞれがもつカテゴリの集合に関する類似度。 共通要素数 / (それぞれの要素数の和 - 共通要素数) より、

  • 同じ要素しか持たない場合、1
  • 共通要素なしの場合、0

ソーシャルゲーム

仕事で必要になったので、仕事中にやっていた。収集癖のせいで土日も割りとやっていたので死にたい。

AtCoder ABC

ゲームやってて見逃した。

まとめ

  • repositoryの整理がだいたい済んだので、時間かけすぎないように整理
  • BigQueryをがんばる
  • 集合知プログラミングを引き続きやる
  • 次週はAtCoderやってない分をやる