99ln(99/e)

人生のログ(にしたい)。本のメモや感想を中心に。

AP受かったっぽい

2016年秋の応用情報技術者試験うかったっぽいので早速。合格証書はまだ先なので一応ぽい。

そもそも如何に適当なスタイルで受かったかどうかを書くためだけに受けたので証書も届いてないうちにノリノリで書いておくわけですね。だので当然役に立つ記事ではないです。

 

本来は成績も見れるんですが、受験票を捨ててしまってパスワードを請求しないといけなくて面倒くさいから分かりません。受験番号は電話で問い合わせました。

 

・バックグラウンド

学部は非情報系でアナログな感じの工学部でした。いまはインチキ情報系。インチキというのは名称の上では情報と付くけどとくにそういうことはやらないという意味。気持ちの上での本業は統計学寄りのこと(そうか?)

Pythonくらいは書くけど数値計算とか数値実験とかしかやらないので(しかもお作法が身についていない)APには全く役に立たなかったです。

というわけで予備知識はほぼ無かったです。

 

・やったこと

試験前の1週間前までペルソナ5のせいで忙しくて何もしてなかったです。その後の1週間でこれを電車移動の間とかにとにかく周回。*1

 ですが前日か前々日くらいに過去問道場がとても便利になっていることを知って、そのあとはこっち。

www.ap-siken.com

今後受ける人は古い年度も含めてとにかく道場周回すればいいんじゃないかと思います。よくわかりませんが。

 

午後は経営戦略とアルゴリズムと組込みとシステム監査を選択しました。

午後は国語の問題でしょwと舐め腐っていたので過去問を解くことさえしてないくらいに全く何もやってないです。今回は簡単だったので困らなかったけども常識的に考えて過去問くらいはやるべきだと思います。

 

合格教本もありましたが、結局広く浅く書かれていて読み物として面白くないので全く活用できてないです。

 

・感想

勉強中は何だこのつまんねー試験はとか思ってたんですが、受かったことが分かるとまあ嬉しいもんですね*2

 

*1:若干盛っている。正確には申込み直後はやってた

*2:まあろくすっぽ……

『データ解析のための統計モデリング入門』3章と6章覚え書き

Pythonでやってみた系のあれ。結局pandasとかstatsmodelsとか初めて触れるんだからRで書いてある通りに実行したほうがいいのでは?とかQiitaに書けとかQiitaにすでに記事いくつかあるじゃんとかは気にしない気にしない。

続きを読む

『情報量基準』

 

情報量規準 (シリーズ・予測と発見の科学)

情報量規準 (シリーズ・予測と発見の科学)

 

 いい本です。借りて読んだけれどそのうち買おう。

 

1章:統計的モデリングの考え方

「統計的モデリングの目的は、現在のデータを忠実に記述することや「真の分布」を推定することにあるのではなく、将来得られるデータをできるだけ精確に予測すること」と赤池の指摘が要約されている。過学習を避けて汎化能力を上げることは大事。で、その汎化能力をカルバック・ライブラ情報量で評価するというのが情報量基準の基本の考え方っぽい。

ちなみに正則化項を付与する推定方法を純然な統計学の本で初めて見た(勉強不足なだけでは)。

 

2章:統計的モデル

分布関数とはや種々の分布や回帰モデルの紹介から始まる。スプラインでのフィッティングってそんなことやってたんだと素朴に思った。時系列分析も空間モデルもまあ結局変数が違うだけでただの条件付き分布なんだよな。あと制御っぽい講義でやってる状態空間モデルがここでも出てくるのかとか、空間モデルの話は面白そうというかまんま多体問題やんけとか。

 

3章:情報量基準

KLdは平均対数尤度の差に分解できるから分布間の近さのようなものの尺度に丁度よくて、経験分布関数の対数尤度もサンプル無限大の極限で平均対数尤度に確率収束するから、最尤法で対数尤度が出てくるのは自然。関係ないけど最尤法は入門書だとだいたい対数を取らないと計算が面倒くさいからだとか書いてある印象がある。対数尤度はフィッシャー情報量(行列)も対数尤度関数の微分の期待値の2乗だから(というかKLdの近似値なんだな)大事な量だしさらに言えばexp(-βH)が念頭にあれば自然というか。

あとニュートンラフソン法などの紹介中心極限定理とかやったところで満を持しての情報量基準。比較の尺度としての最大対数尤度は、バイアスの大きさがパラメータの次元によって異なってよくないからパラメータの次元に応じたペナルティが必要。

 情報量基準の一般形は-2(統計モデルの対数尤度−バイアスの推定量)で、バイアスの推定量次第でTICやAICが導ける。とくに統計モデルのパラメータ空間の中に真の分布が含まれていると仮定すれば、漸近的にバイアスの推定量がモデルの自由度になっていて、これがAIC。あとは具体例。

 

4章:統計的汎関数

要約になっていない要約がダルくなってきたので割愛というかここはむつかしくて分かってない。統計的汎関数を定義して何やかんやすると一般化情報量基準を導出できて、このGICが正則化法や非線形モデルでの情報量基準として使えるっぽい。 

5章:ブートストラップ情報量基準

経験分布関数を使って何度も復元抽出を行うのがブートストラップ法という認識しかなかった。いや信頼区間を構成できたり何か色々都合がいいらしいくらいまでは聞いてたような。ブートストラップ法を用いるとブートストラップ法を使ったときのバイアスの推定量の形に当然なるので情報量基準もブートストラップ法専用のが必要っぽい

 

6章:ベイズ型情報量基準

ラプラス近似の導出が丁寧に載っていて助かる。BIC,MDLはともかくGBIC,ABIC,PICと出てきて少しだるくなる。BICはあくまで最尤法によって推定されたモデルの評価基準で、データ数が十分大のもとで事後確率をラプラス近似したものだから正則化法には使えないので拡張していく流れ。最小符号語長がBICと同じになるのは面白い。

 

7章:様々なモデル評価基準

クロスバリデーションとかMallow's C_pとかその辺。Mallow's C_pはAICの特殊な場合という認識しかなかったな。

 

近況3/15

いまは卒論発表を無事終えて(直後の懇親会的なものでやらかしはしたけど)その翌日に即帰省をし療養中。

療養ということでストレッチから始めてぼちぼち運動をしてる。最初は軽いストレッチで全身の筋肉と関節が悲鳴を上げたり、腕立て伏せをすると肘が軋む上に5回で限界だったのが今はだいぶ(比較的)ましになった。

運動のおかげかストレスの少ない生活をしてるからかは分からないけど、勉強も再開できたし、夜に寝れて短い睡眠時間でも起きられるようになったし、全体的な体調不良もなくなって著しい回復を感じているところ。

筋トレをもっと回数こなせるようになりたいとかもっと時間・距離的に長く走れるようになりたいとかそういう風に思えるようにもなった。今は元が酷かっただけに成果が目立つけれど落ち着いてからも続けられたらいいなと思う。

 

確率・統計は確率変数の変換と検定ら辺をさっさと思い…出したをして問題ガリガリ解く段階に戻りたいところ。それはそうなんだけれど計算力が落ちてる。確率過程とベイズ統計と情報理論もやらないとなーあーあー。

 

将棋のほうは囲碁・将棋チャンネルで対局をだらだら観たりはしているものの(移動中の暇つぶしだった)詰将棋をやらなくなったり全く指さない日が増えたりとで何か更に弱くなった気がする。

『脳を鍛えるには運動しかない!―最新科学でわかった脳細胞の増やし方』

 

脳を鍛えるには運動しかない!―最新科学でわかった脳細胞の増やし方

脳を鍛えるには運動しかない!―最新科学でわかった脳細胞の増やし方

 

 基本的には、「運動(有酸素運動)をすると脳にいい」みたいなことが、そのケース(うつ、ADHD、加齢など)に応じて、マウスや人間での実験結果などの例とそれに対して考えられそうなメカニズムが延々と書いてある。ケースによって機構が違うのは分かるにしても、とにかく「運動はいいぞ」の繰り返しではあるので単調で飽きる。そのせいでタイトルの割にはしっかりした内容ではあるんだけどもタイトル通り自己啓発書めいてるというか。まあ走る気にはなれると思う。

 

筋トレなどの無酸素運動だと、マウスにスクワットさせるわけにもいかないし、人間にやるにしても何が主要項なのか分からないから何とも言えないっぽい。気分はよくなるけれど、認知機能は向上しない実験結果もあるとか何とか。

 

正直ここまで欲張らなくても体力を取り戻したいし実際気分は晴れる感じがするし運動はいいっぽい。

 

まず、気持ちがよくなり、頭がすっきりし、注意力が高まり、やる気が出てくる。つぎに、新しい情報を記録する細胞レベルでの基盤としてニューロンどうしの結びつきを準備し、促進する。そして三つ目に、海馬の幹細胞から新しいニューロンが成長する のを促す

 

脳にしてみればストレスはすべて同じで、違うのはその程度だけなのだ。

ニューロンは筋肉と同じように、いったん壊れて、より丈夫に作り直される。ストレスによって鍛えられ、回復能力を増していくのだ。こうして運動は心身の適応能力を 磨き上げていく。 ストレスと回復。それは生態系の基本的な枠組みでときに驚くほどの成果をもたらす。

 

DNAに刻み込まれた古代の活動は、おおまかにウォーキング、ジョギング、ランニング、全力疾走に置き換えることができる。

最後のジワジワ来ませんか。

将棋

1月の頭くらいから何故か将棋をはじめた。ヘボいけど楽しい。何故はじめたかといえば周囲で流行っていたからだけれど、流行り自体は12月くらいからだったし、夏には某まるさん、そういえば去年には同期に誘われていたのにこのタイミングからだったのはよくわからん。

現状ウォーズはこんな感じ。

f:id:spellm:20160206131643j:plain

ウォーズはじめて少ししたところに同期に直接右四間教えて貰って以来右四間厨になってしまった。覚えたてのころは全く成功しなくて右四間のせいで全体勝率が下がっていったのが、今では右四間勝率のほうがいいのでもう全く言い訳できない。

右四間のときの舟囲いが舟囲いカウントされないのとカニのほろ酔い囲いが無いので、得意戦法と得意囲いが乖離している。

・流れ

(12月下旬に将棋盤を貰い機種変のときにiPadを手に入れる→)1月頭に何となくウォーズで指し始める→同期に観戦されていたせいで何かの折に直接教わり、羽生アプリはいいぞという話を聞く→某氏の樹でもおすすめされていたのもあり購入→楽しい→一日3局がまどろっこしくなりウォーズ課金→詰将棋を始める→右四間本を買ったり貰ったり(身についていない)→一目の手筋を買う→今

羽生定跡アプリはとりあえず代表的な戦法の触りが色々載っているので適当に眺めているとこれやりたい!みたいな感じでモチベが湧くのが一番いいところだと思う。最序盤における諸々の対策なんかはもう少し活用できる気がする。

ウォーズ課金して一ヶ月間指し放題になってしまったので負けが続くとつい勝てるまで反省もせず対局してしまって更に負けるという負のスパイラルで勝率が4割後半から3割台に落ち込んだ。指し放題だとなんというか2048ばりにとにかく惰性で続けて時間を浪費してしまう。期間が終わったら当分1日3局に甘んじますはい。

・変わったこと

少し前まで感情が完全に死んでいたのもあって電車移動中は駅メモ(ブルーライセンス)ポチポチマンだったのが、最近は延々と詰将棋をしている。電車ソシャゲマンよりは詰将棋マンのほうが文明人という感じがする。そうか?3手詰めハンドブック一通り終えてだいたいサクッといけたなと思ったので5手詰めに移ったけどあまり解けないというか時間がかかりすぎるので3手詰めやり直した方がいい気もする。

・今後

早石田やゴキ中されるとまず序盤からもうだいたいダメなのを何とかしたい。おれも暗黒面に落ちるか。どんな戦法でも序盤〜中盤の駒損が多くてそのまま負けるのと無理攻めして負けることが多いのでそこもなんとか。あとはどんどん右四間しかできなくなっている(棒銀しかけようと思ったら普通に間違えた)ので他の戦法も覚えないといけない。居飛穴だ居飛穴しかない。あと詰将棋

 

 

『ウォール街の物理学者』『金融の世界史: バブルと戦争と株式市場』

年末に読んだ2冊なのでまとめて書く。どちらも面白かった。 

ウォール街の物理学者 (ハヤカワ・ノンフィクション文庫)

ウォール街の物理学者 (ハヤカワ・ノンフィクション文庫)

 

「この本は、金融の世界に飛び込んでいった物理学者たちの物語だ。二〇〇八年の金融危機のこともでてくるけれど、それは話の一部にすぎない。(中略)でも僕が書きたいのは、もっと大きなテーマだ。クオンツというものがどうやって生まれてきたのか、そして現代の金融理論に欠かせないものとなった「難解な数理モデル」 とはいったい何なのか、それを理解する試みだ。」 

……と、概ねイントロダクションに書いてある通りの内容。中盤くらいまでは著名な物理学者・数学者・情報科学者(ポアンカレ、ギブス、マンデルブロ、シャノンなどなど)が(指導教官であったり共同研究者であったりあるいは当事者として)これでもかと出てきて取っ付き易いというかお前か!となる。ブラック・ショールズ方程式で有名なブラックも自然言語処理に貢献していたとか、ソネットとかいう何でもやるマンとか、何というかすごい人はすごいなあ、みたいな。

確かに、クオンツというものがどうやって生まれてきたのかについてはよく分かった。「難解な数理モデル」とはいったい何なのかは結局良くわからず仕舞ではあるが、ランダムウォーク・モデルは1900年のバシュリエの博士論文まで遡るというか、(その後約50年間日の光を見なかったとはいえ)かなり古いものだということを知れてよかった。

 

金融の世界史: バブルと戦争と株式市場 (新潮選書)

金融の世界史: バブルと戦争と株式市場 (新潮選書)

 

金融の世界史というか、お金(広義)にまつわる世界の話が色々と書いてあるという印象。メソポタミア文明が如何に先進的であったかや、世界各地で今で言うオプション取引がどれだけ古くからあったのか、有名な戦争や革命の時期での各国の経済状況がどうであったのかなどが書いてあり、興味深く読めた。

ただ古代〜中世〜近代くらいまでは面白かったものの、比較的現代の話では酒田五法をはじめ明確に根拠があるわけでもないテクニカル分析(笑)に紙面が多く割かれているのはあまり面白くなかった。

 

モデルから出発する場合はランダムウォーク・モデルのような単純なモデルはあくまで出発点であり、実際のデータとの解離具合から適宜修正する必要があるというのは実際そうだし、前述の本にも書いてあるし、修正されたモデルも実際色々とある(らしい)。最近の大失敗は古い単純なモデルを頑なに使い続けたため、と前述の本にも書いてあるし、その辺りの経緯を考慮しないでモデルから出発するのはどうこう、というのは早計だと思う。モデルから出発するからこそ、現実のデータと対比したときに、どの仮定がどのように現実的でないかが明らかになるわけで。

人間はランダムかそれに近いようなデータ列を見ても勝手に法則性のようなものを見出してしまうので、モデルではなく実際のデータから規則性を抽出することから出発する場合は尚更実際のデータとの一致性が求められる(と思う)し、それに基づく予測が外れたときに説明のしようがなくなりかねない(と思う)。とりわけそれを人間がやってしまう場合はどれだけバイアスがかかるかもを考えると色々通り越して恐ろしい。

2016 12/20追記

何か久々に読んだら意味分からんことが書いてあったので打消。一致性とかバイアスとかいう単語を使うと統計の文脈に思われかねないのでだめだな。こういう場合は予測誤差が小さいモデルがよかろうと思われるので統計でいうところのバイアスはあってもいいです。何でも直線、何でもガウシアン、こんな感じで線を引ける気がする、とかはよくないです。