Diary September, 2007

 

05日Wed.

先週の土曜日から昨日まで、 箱根で行われた、ダークエネルギーのサマースクールに行って来た。 はじめは行くつもりは無かったが、 締め切り後にもあまり人が集まっていなかったらしく、 募集期間が延期されていたので行くことにした。

最初いくつもりが無かったのは、 基本的に東大ビッグバンセンターを中心としたグループの「研究会」なので、 自分は部外者的に感じたから。 募集期間延期後は、tennetへの連絡なんかもあり、 東大以外からも募集があったようだ。 多分、皆同じことを考えていたのではないだろうか。

研究会自体は、大変面白かったし、自分を奮い立たせるいい機会になった。 今後、自分が上手くこの業界に残れれば、 必然的に顔を合わせる同年代のことがよく認識できた。

正直彼らと同じ土俵に立とうとは思わない。 勝てないし、そもそも自分の興味とは異なる。 幸運にも自分の興味は、彼らの興味とは異なるので共存が可能だ。

電波の人もいた。 電波の中には○○○○のあとはCMBと、 考えている人もいるらしく、送り込まれてきたとか。 じっくり話しました。CMBが電波で広がりますように(CMBは「そもそも」電波だ。この表現はおかしい。)。

個別の研究発表では、横山先生の発表が興味を引いた。 ダークエネルギーとは直接関係無いが、CMBということで。 (というかCMBの発表の人がいなかったな)

興味を引いた理由は、対象は違うが手法が自分のやっていることと同じであったこと。 でもどうも「階層ベイズ」ら辺のことをよく認識しているとは思えなかった。 事前情報を使う利点は、認識しているのだがその重み、ハイパーパラメータの決定について明確ではないように感じられた・・・、 誤差評価も・・・。 なのでコメントしておいた。適切だっただろうか・・・・。 因みに、コメント・質問は英語がデフォルトなので英語に泣きがある自分は、 講演終了後こっそり個人的にコンタクトをとったのであった・・・・。

ochi.jpg

本当にいろんな意味で、研究会に参加したことはプラスだった。

費用は、補助を申請しているのでほとんどかからなかった。 さすがに「フリーディスカッション」の費用は出なかったが、 交通費以外に日当も出ているので、赤字になることは先ず無いだろう。

もし自分が東北大学生でなかったら、 こんな研究会に参加できないし、お金が援助されることも無い。 税金で「本当に好き勝手できる」権利を持っている(権利を持っているだけ)ことはすばらしい。 改めて自分が普通じゃない(すごいという意味ではない、特異)ことを自覚した。

sake.jpg
研究会のひとこま。これも国民の○○かと思うと、本当に勉強はたいせつだなぁと思います。こんな権利は他には売ってません。

各種研究会には積極的に参加したいのだが、 如何せんお金がかかりするぎる。

研究費が無い東北大学修士はどこに行くのも自腹。 天文台や東大が羨ましい。 同じ権利をもつ人間でも、権利を実現される度合いは異なる。

場所は「強羅」だったのだが、強羅といったらあれしかない。分かる人にはわかるはず。いつ見に行こうかしら? 自分と数人は「フリーディシカッショん」を芦ノ湖で行ったのだが、芦ノ湖は「一つ」しかないようだ。第三新東京市はまだ無かった。芦ノ湖北岸(神奈川県足柄下郡箱根町仙石原地籍付近)に第3新東京市が作られた。もう少し詳しく予習しておくべきであったか。

昨日仙台に帰ったのだが、東北大天文の院試最終日だった。 服部研には二名合格した。 来るか来ないかは本人次第。 悔いの判断はしてもらいたい。

今回も東大併願が多い。 強くは言わないが、 東北大と東大天文・物理だったら、積極的な理由が無い限り東大を選ぶのが吉であろうと自分は思う。

自分は積極的な理由があったので東北大学に残った。 しかし、まだやりたいことが不明確だったり、東北大学にこれだっという人がいないのであれば、 東大に行ったほうがいい。 東大にいってどうなるかはその人次第であるのは、いうまでも無いが。

大学・教官の皆様方(東大・東北大学どちらも)はいろんなことを言ったりして人を獲得しようとするが、それには裏がある。 そういう事情が分かるようになったのはいいことなのか、悪いことなのか分からないが、事実はそうである。

人事は・・・・。無かったことに。危ないないので

さて、研究会も終わったので気分を一新して研究を始めます。 夏の学校とも適当に付き合って、どうにか修論を書き、 出来れば投稿までもっていきたい。 あと少し・・・、では無いけど時間が無いわけではない。 精進します。

daru.jpg

06日Thu.

昨日は会議があったので安めなかったので、 今日は遅くまで寝た。

13:30出勤。

お客さんのセミナー+夏の学校の仕事で時間が飛ぶ。 メーリングリストをどうにか作り上げた。 自分仕事周りに不満が無いが・・・。 管理職はつらい。

来年の一月から二月にかけてASPENで行なわれるCMBの研究会に是非とも行きたい。 可能なら発表とかも・・・。

In case you haven't heard yet: we've got the Aspen Winter Conference assigned for
the week of Jan.27-Feb.2.

I sent to Aspen the following specifications required for the conference flyer:

Title:
"Cosmic Microwave Background in Modern Cosmology" (Jan 22- Feb 2)

Description:
The cosmic microwave background has now blossomed into a precise cosmological probe.
With last year's release of the WMAP 3-year data, a healthy crop of ongoing suborbital experiments,
and the forthcoming launch of the Planck satellite, the time is ripe for theorists, experimentalists, and data analysts
to come together and take stock of what we have learned and think more carefully about the science opportunities for Planck.
The intention of this conference will be to review the current measurement results and determine strategies for forthcoming CMB experiments.
The topics to be discussed will include the inflationary gravitational-wave background, searches of non-Gaussianity,
cosmic-shear measurements with the CMB, and synergies between the CMB and other cosmological probes.

The organizers are:
Krzysztof M. Gorski
Marc Kamionkowski
Amber Miller
Eiichiro Komatsu
Matias Zaldarriaga

The application deadline: Oct. 31, '07 

大学院GPでお金は出るようなので、さっさと手続きをしたいところだが問題がある。 時期が悪い。修論発表、提出の時期にばっちり重なっている。 さてどうしたものか。

APPLEが新製品を発表した。 第6世代iPodであるiPod classic 160GBが激しく欲しい。 値段も4万円とお手ごろ(5.5世代買わなくてよかった)。 自分がHDDオーディオプレイー買った(iPodではない)5年ほど前は、この価格で20GBだった。 操作性(今ので満足はしているが)・液晶(今のは白黒です)・バッテリー(昔7時間、今へたって3時間)と相等に進化していることも加味して、更に欲しい。

今日は何時までがんばろうか。 台風の影響で明日は大荒れだし。

土日休みたいが、仙台ジャズフェスティバルもあるし。 今年は行きたいので。

naga.jpg

長靴「にはいった」ネコ


07日Fri.

昨日は眠れなかったので、 早朝のバスで大学へ。 かさが折れた。 わざわざ探して買った、大き目の傘だったのだが。

一般的な画像解析では事後確率分布を計算する場合、 すべてのピクセルについて積を計算し、MAP推定をする。

P({\bf \theta}|{\bf f})= \prod_{i} P({\bf \theta}|f_i)

例えば&mimetex(N_{\rm pix})の画素を持つ2値画像の場合、 MAPは&mimetex(2^{N_{\rm pix}})次元で推定することになる。

一方Eriksen、WMAP MEMの方法ではこのようにはなっていない。 積を計算しているのは周波数だけである。

-2\log P({\bf d}|{\bf \theta})  \propto \frac{\left[   {\bf d}_\nu(p) - {\bf S}_\nu(p) \right]^2}{2\sigma_\nu^2}

寝落ち

10日Mon.

まったく気合が入っていない。

土曜日は定禅寺ジャズフェスティバルに行ってきた、 その帰りにてぃば先生に会ったとかとか、 iPod classicがよかったとか、 日曜日は何も出来なかったとかいろいろ書くことはあるが、 書かないことにします。

寝落ちしてしまった先週末の続きだが、 空間的な事前情報、つまりforeground(とCMB)は空間的に特徴的な分布をするという情報を使うには、 ピクセルで積をとらなければならない:

\sum_{\nu,i} \frac{\left[d_{\nu,i}-s_{\nu,i}\right]^2}{2\sigma^2_{\nu}}  + \sum_{\nu,i}\lambda \left( s_{\nu,i}-s_{\nu,i-1}\right)^2(1-l_{\nu,i,i-1}) +\sum_{\nu,i}  \alpha \lambda l_{\nu,i,i-1}

今、ハイパーパラメータの推定を考えなかった場合でも、 上記の#mimetex(s_{\nu,i});の推定には計算コストがかなりかかる。

これに対する最適化も含めて結果とするか、 とりあえず計算できる解像度に落として計算し、 どのようになるのかを見てから、 現実的な解像度にした場合どうするべきかを考えるかを悩むところ。 修論としては、後者でもいいかもしれない。 当初の進め方には問題があった。反省。

今はとりあえず動くコードを書いて、 自分独自に考えた解析方法が意味のあるものなのかを示す必要があるのだと思う。

MEMはピクセルについて積をとってなくて、 foreground template substructionだと積とっている。 計算回数はどうなっているのだろうか? 何で推定しているのだろう?

海外でニューラルネットワークを使って事前情報なしに解析しているのはすごいと思った。

hukuro.jpg

12日Wed.

今週はだめぽ。

エヴァ見に行かないと、近場での公開が終わってしまう。 金曜日までは確実に公開しているが、それ以降は要問い合わせ。 いつ行く暇があるだろう。

eva.jpg
これは偽者

先の夏の学校(注:戸谷さんの講演)でもあったように、 天文学をやる上でガンダムの知識が必要不可欠であることが分かる。特に一年戦争。 復習の意味でもう一回見直そうかしら、大きな画面で

gufu.jpg
グリとグラとは違うのだよ!

今日はAKARI解析の方向性について議論があった。 検出器のことは検出器の人に任せて、 キャリブレート後のデータを単純にマップにすればいい、 という状況が最も単純であるが、現実はそうでない。

現在自分のコード使って書いた強度マップは明らかにスキャンごとの斑がある。 SN, varianceであれば、観測回数が異なることから理解できるが、 キャリブレートが上手くいっていれば、スキャンごとのパターンは見えてこないはずである(このいいかたは正しくは無い)。

画像解析の立場に立つと、 ゴースト除去・クロストーク除去・ノイズ除去・平滑化・シャープ化等により補正を加えることが出来る。 一般の画像解析で最も重要なのは、人が見てきれいにみえるかである。 (この周辺のことは、ごにょごにょをごにょごにょするのに勉強したことがある。 ツールの使い方以上のことは調べなかったが、過程でアルゴリズムなんかも少しは調べた。)

しかし、観測結果がきれいに見えるかは本質でなく、 単純に画像解析の手法を用いて最適化するのは、必ずしもよろしくない。

画像解析の手法を使って最適化するのではなく、 画像解析の前処理(エッジの検出、特定のパターンの検出)等の情報を使っを検出器のキャリブレートにフィードバックさせるのが、 「最適な」方法だと思われる。 とても大変であることは、やる前から分かる。 今後の自分の作業は、こちらに進んでいくことになると思う。

今までは、AKARIに関する最低限の理解、 プログラミングスキル、FITSの知識程度でどうにかなったが、 今後はそうはいかない。

IRAS, WMAP等の全天サーベーでの手法を調べてみたり、 画像解析の手法(ウェーブレット変換なんか多分使うのだろう)を応用してみたりと本格的になってくる。 修論との兼ね合い、そしてその先の研究との兼ね合いもあるので計画的に進めていきたいと思う今日ここの頃である。

大業なことをいっといてなんだが、修論はどこまでいけるか真剣に考えなければならない状況だ。 当初の目論見ほど上手くいかないのでは?といったことが分かってきた。 ただし手法としては新しく、結果も独立なものであるからやることに意味はある。 ・・・結果はまだ出てないけど。

問題設定明確にし、現状・未来・類似研究と比較・参照しながら実際に作業を進める時期が、少し遅すぎたと反省している。

M1前半は銀河団(それも特定の問題)、M1後半は機械・パソコンいじり、 M2からCMB解析の本格的なこと、今。 宇宙論については、通年ゼミを続けてきたおかげで、 最低限の知識はあり又手も動かせるレベルまでにはなった。

銀河団、機械・パソコンいじりが無駄だとは思わないが(人間関係とか国際学会で名前が載った・・・とか)、 修論と直接つながっていないのは事実。

cat.jpg
たしか前にも張ったような・・・

あまり意識していないが、 この日記少なくても定期的に見ている人が五人ぐらいいるんだよな・・・。 外部の人も居るとか居ないとか。 あんまり変なこと書くと問題があるのだろうか・・・。 指導教官のこととか(悪口はいっておりません)、業界の悪口とか。

boot.jpg
  • 外部からだったり内部からだったりしてるけどね。 -- bose? 2007-09-13 (木) 11:34:16

15日Sat.

昨日は飲み会。 正午頃大学到着。

今週は負け続きだったので、最後ぐらいきちんとしたかったのだが。 自分が「負ける」ときの条件は

  1. 夜更かし⇒午後起床
  2. テンション下がる
  3. 中身の無い嗜好(過去の反芻)⇒時間の浪費 1〜3の繰り返しである。

何度も言っているが、規則正しい生活は何物よりも尊い。

飲み会の前にヱヴァ:序を見てきた。 ラミエル最高、これを見るだけでも映画館に行く価値がある。

内容は基本的には過去と同じだが、 所々ここ違う、飛ばしている、追加していると変化はある。 この変化が複線になっているはず。 それにしても、この映画で初めてヱヴァを見るという人には、 内容は理解できないのでは?、と思われる。

過去でも作画レベルは高かったが、今回は作画のレベルに付け加えて、 CGでの表現が目を惹く。兵装ビル等が3Dで書かれていたりもする。 エフェクトなんかも綺麗にかかっているのだが、一つ気になることが。 それは虹(色)のエフェクト。 いろんな所で出て来るが、 物理的(所謂「虹」の見えるメカニズム)にあり得ない状況で出てくるときがある様に思えた。 気のせいかもしれないが。

次の「破」からは大きく変化することが予告から見て取れた。 次回作も見に行くこと決定。 そのころ自分の研究はどんな状況だろうか?

新旧エヴァのつながりについて
  ├─新旧エヴァはリンクしてるよ(リンク派)
  │   ├─新ヱヴァは旧エヴァの続きだよ(新約派)
  │   │    ├─海が赤いのが証拠(赤潮派)
  │   │    ├─冒頭の巨人の跡が証拠(巨人党)
  │   │    ├─旧作のすぐ後のやり直しだよ説
  │   │    ├─旧作から随分たった後の世界だよ説
  │   │    ├─創造主の世界説(創世記派)
  │   │    |    ├─キール議長が神様だよ説
  │   │    |    ├─シンジが神様だよ説
  │   │    |    ├─ゲンドウが神様だよ説
  │   │    |    └─庵野が神様だよ説
  │   │    ├─所信表明で繰り返しの物語って言っている(所信表明派)
  │   │    └─新ヱヴァの舞台は地球ではないよ(別惑星説) 新説
  │   ├─新ヱヴァは旧エヴァの前の話だよ(旧約派)
  │   │    ├─旧仮名遣いが証拠(歴史派)
  │   │    └─初期の企画書に基づいているんだよ(企画書派)
  │   ├─単純に新旧を繰り返してるんだよ(狭義ループ学説)
  │   │    ├─シンジだけループしてるよ(ありがちFF派)
  │   │    ├─レイだけループしてるよ(先レイ派)
  │   │    ├─カヲルだけループしてるよ(カヲル派) ※
  │   │    ├─チルドレンみんなループしてるよ(チルドレン派)
  │   │    ├─SEELEだけループしてるよ(SEELE派)
  │   │    ├─全人類ループしてるよ(純ループ学説)
  │   │    ├─世界がループしてるよ(大ループ学説)
  │   │    │    ├─旧作から時間が巻き戻り新たな展開だよ説
  │   │    │    ├─火の鳥の世界だよ説
  │   │    │    ├─キリスト復活の世界だよ説
  │   │    │    └─仏教の輪廻転生の世界だよ説
  │   │    ├─むしろ観客がループしてるよ(進歩無し派)
  |   │    └─むしろスレがループしてるよ(既出質問ウゼー派)
  │   ├─ループにエヴァ2も含まれるよ(拡大ループ学説)
  │   ├─新ヱヴァだけを繰り返してるんだよ(広義ループ学説)
  │   └─新旧的なことを繰り返しつつ進歩してるんだよ(スパイラル学説、進歩派)
  │        ├─シンジだけスパイラルしてるよ(スパシン派)
  │        ├─チルドレンみんなスパイラルしてるよ(ひぐらし派)
  │        ├─ミサトがスパイラルしているよ(カーペット交換派)
  │        |    └─新キャラはミサトの2Pキャラだよ(声優が分れば派)
  │        ├─全人類スパイラルしてるよ(純スパイラル学説)
  │        └─世界がスパイラルしてるよ(大スパイラル学説)
  ├─新旧エヴァは独立だよ(独立派)
  │   ├─新旧エヴァは全く接点がないよ(独立過激派)
  │   ├─大月Pが同じ時間軸って言ってたよ(大いなる月派)
  │   ├─海が赤いのはただ単にセカパクが大規模だったからだよ(赤潮反論派)
  │   ├─巨人の跡は第三使徒かNERVの偽装工作だよ(アンチ巨人派)
  │   ├─新ヱヴァは地上世界と月世界の対になってるよ(かぐや姫派)
  │   ├─パラレルワールド説(保守本流派)
  │   │    ├─旧作とは全く違う世界だよ説
  │   │    ├─旧作とは別次元の宇宙だよ説
  │   │    ├─旧作とは同次元の異なる天体だよ説
  │   │    └─旧作とは同じ舞台だけど異なる展開だよ説
  │   ├─ただしカヲルだけは旧エヴァの記憶があるよ(カヲル派) ※
  │   └─実は新ヱヴァは旧エヴァの劇だよ(終局の続き派)
  │        ├─旧エヴァの痕跡は舞台が同じだからだよ(第二回公演派)
  │        ├─監督が使徒役で出演するよ(帰ってきたウルトラマン派)
  │        └─最後に監督が生で説教をしてくれるよ(EOEの悪夢再び派)
  ├─どっちとでもとれるようになってるよ(穏健派)
  │   ├─情報が少なすぎてまだ分かんないよ(中間派、様子見)
  │   │    └─つーかまだ見れてない(未見派)
  │   │          └─でもスレだけ読んで議論に参戦(ヤジウマ派)
  │   ├─結局アンノに踊らされてるんだよ(陰謀派)
  │   │    └─どうせパチンコとか商業展開が全てなんだろ(市場原理派)
  │   └─まだ庵野監督は先の展開を考えてないよ(予定は未定派)
  │        └─ココを見ながら次の展開を考えているよ(フィードバック派)
  └─とにかくエロければいいよ(エロリスト派)
      ├─やっぱりおっぱいだろ(乳首券派)
      ├─いやいや尻だろ(予算欠乏派)
      ├─ミサトの下着がエロくなってる(下着派)
      ├─新キャラだろ(眼鏡派)
      ├─いいから霧島マナを出せ!!(鋼鉄派)
      ├─新ラミエルになら掘られたい(うほっ派)
      └─カヲ×シン(801派、異端思想)
テレビシリーズを提案したときのタイトルが「ヱヴァンゲリヲン」だった。
旧仮名化されたのはエヴァンゲリオンの1文字目と7文字目。 
虹=虫+エ 
蛇=虫+ウ+ヒ 
ヒを逆さにするとヲ。 
ヱ=ウエ 
明治以降、外来語の特殊表記として以下の方法が考え出された。
「うぃ」「うぇ」を「ウヰ」「ウヱ」等と表記する。 
「うぃ」「うぇ」を「ヰ」「ヱ」等と表記する。 
「ヴァ」を「ワ゛」(ワに濁点)と表記する。
white.jpg

16日Sun.

朝の八時頃まで大学に。 そういえば、昨日は断水だったらしいが、水は問題なく使えた。

午前中に家に帰り、家のことを。 今日は眠いので、 もう寝ます(早寝早起き)。

de.jpg

17日Mon.

朝四時起床、外はまだ暗い。 五時に大学到着。 17時に帰宅。

今日は休日だったのか? 人が少ない。敬老の日?

とても内容のある日だった。 対数尤度、情報量基準、カルバック・ライブラー情報量、AIC、モデル選択、 周辺尤度、MAP推定、訓練誤差、汎化誤差、ABIC。 これらのつながりが有機的に分かった気がする。

帰る間際、CMBについていろいろと読まなければならない論文も見つけた。

自分のやろうとしていることは、 実空間で周波数依存・空間分布の事前知識をもとにforegroundとCMBの分離を行うこと。 よそでは、これをフーリエスペース(C_l)でごにょごにょしてCMBを推定、ってな感じ。 Independent Component Analysis(ICA)とか言われている(別のもの?他にもblind component separationとか有るが・・・)。 ニューラルネットワークを使うのもこのやり方。 どっちがいいのか(自分の奴はまだ何もできていない)は、分からない。 ただ、WMAPはthree yearで「実空間で差し引いた」と強調していた(小松さんの講演とかで)。


D{\rm :\,\, data},\,\,w{\rm :\,\, parameter},\,\, \alpha,\beta{\rm :\,\, hyper-parameter},\,\,{\cal H}{\rm :\,\, model}

パラメータの事後確率分布

P(w|D,\alpha,\beta,{\cal H})  = \frac{ P(D|w,\beta,{\cal H}) P(w|\alpha,{\cal H})}{ P(D|\alpha,\beta,{\cal H}) }

ハイパーパラメータの事後確率分布

P(\alpha,\beta|D,{\cal H}) = \frac{ P(D|\alpha,\beta,{\cal H}) P(\alpha,\beta|{\cal H})}{ P(D|{\cal H})}

モデルの事後確率分布

P({\cal H}|D) = \frac{ P(D|{\cal H})P({\cal H})}{P(D)}

MAP推定値(Maximum A Posteriori)
パラメータのMAP推定は、 wに対してP(D|\alpha,\beta,{\cal H})は一定なので、

w_{\rm MP} := \arg\,\max_wP( w|D,\alpha,\beta,{\cal H}) = \arg\,\max_w P(D|w,\beta,{\cal H})P(w|\alpha,{\cal H})

ハイパーパラメータ周辺尤度(hyperparameter marginal likelihood)(ABIC、evidence)は以下で定義される:

P(D|\alpha,\beta,{\cal H}) = \int  P(D|w,\beta,{\cal H})P(w|\alpha,{\cal H})       dw .

これよりハイパーパラメータのMAP推定は、\alpha,\betaに対してP(D|{\cal H})は一定であることを考慮して、

(\alpha_{\rm MP}, \beta_{\rm MP}) := \arg\,\max_{\alpha,\beta}P(\alpha,\beta|D,{\cal H}) = \arg\,\max_{\alpha,\beta}  P(D|\alpha,\beta,{\cal H}) P(\alpha,\beta|{\cal H})

今考えているモデルについて、 ハイパーパラメータの事前分布が単峰で鋭い場合、ハイパーパラメータのMAP推定は、 ハイパーパラメータ周辺尤度の最大化、つまりABICの最小化で求められる。

(\alpha_{\rm MP}, \beta_{\rm MP}) := \arg \, \max_{\alpha,\beta}   P(D|\alpha,\beta,{\cal H}) = \arg\,\min_{\alpha,\beta} {\rm ABIC}(\alpha,\beta)

モデル周辺尤度(model marginal likelihood)は以下で定義される:

P(D|{\cal H}) = \int P(D|\alpha,\beta,{\cal H}) P(\alpha,\beta | {\cal H}) d{\alpha}  d{\beta}.

これより、モデルのMAP推定はモデルの事前分布が一様であればモデル周辺尤度の最大化で可能である。このとき、モデル周辺尤度はモデルのよさを評価する量となりえる。

\arg\, \max_{{\cal H}}    P({\cal H}|D) = \arg\,\max_{{\cal H}} P(D|{\cal H}) P({\cal H})  = \arg\,\max_{{\cal H}} P(D|{\cal H})

今考えているモデルについて、ハイパーパラメータの事前分布が一様、もしくは単峰で鋭い場合

\arg\,\max_{{\cal H}} P(D|{\cal H}) = \arg\,\max_{\cal H} P(D|\alpha_{\rm MP},\beta_{\rm MP}, {\cal H})

であり、ハイパーパラメータ周辺尤度が大きいモデル程(ABICが小さい)、良いモデルとなる。 更に、パラメータの事後確率分布が単峰でとがっていれば、

\arg\,\max_{{\cal H}} P(D|{\cal H}) = \arg\,\max_{\cal H} P(D|\alpha_{\rm MP},\beta_{\rm MP}, {\cal H}) = \arg\,\max_{\cal H}    P(D|w_{\rm MP},\beta_{\rm MP},{\cal H})P(w_{\rm MP}|\alpha_{\rm MP},{\cal H})

ハイパーパラメータMAP推定値(ABIC最小化で推定)が単峰で鋭い場合、このハイパーパラメータ推定値を用いればこのモデルでのパラメータ推定がMAP推定を使うことで可能である。このとき計算されるABICは、モデルのよさを評価する基準となる(モデルの比較が可能)。

更に、情報量規準の箇所で述べたように、仮定したパラメトリック事前分布の族が真の事前分布を含んでいる場合には、ABIC最小化法で選んだ事前分布モデルに基づくMAP推定は、情報量規準の観点から「良い」推定になっている。(真の分布に近い、真の分布であるとはいえない。何故なら、場合によっては真のモデルが選択されず、良いモデルの方が選択されることがあるから。)

そろそろ英語についても具体的に動き始めなければ・・・。

sashimi.jpg

腹が減った・・・。


18日Tue.

今日は五時起床、六時大学、21時帰宅。

昨日の疑問の回答:
Independent Component Analysis(ICA)の日本語訳は独立成分分析。 ここ十年ぐらいで発展した解析手法。 これとは違い、Principal component analysis(PCA)主成分分析もある。

ICAはそれぞれのコンポーネントx_mが独立であると(i.i.d: Independent and identically-distributed)いう仮定の基で、 観測結果s_nからx_mを推定するものである:

s_n = A_{nm}x_m .

i.i.dの仮定から、x_mを推定するには、

x_m = W_{mn} x_n

の独立性を最大にすればよい。 これはそれぞれの分布の距離(それぞれが独立であれば無相関である)のようなものを考えばよい。 平均対数尤度だったりカルバック・ライブラリ情報基準量の使用が考えられる。

こんな話をすると、 単なるパラメータサーチと同じように聞こえるが、 ここで仮定されているのは、 それぞれの成分が独立であるということだけ。

スペクトルの形がどうだとかという議論はまったくやっていない。 分離したいコンポーネント以上の数の周波数データを入れれば、 適当にCMB+foregroundが分離されて出てくる。

この分野は、 統計学として急速に発展したものであり、 その対象を限らない。 同じ時期に研究が進んだニューラルネットワークを使うと、 効率よく計算が可能である。 ニューラルネットワークもまた急速に発展したものである。

PLANCKのシミュレーション結果11 bandsを使い計算するのにかかる時間は、 PenIII 700MHzで数十分。信じられない

ICAの例として、カクテルパーティー効果がある。 カクテルパーティでは多くの人同時にそれぞれ話しをしている。 ところが、これらの多くの声の中から、自分が注目している声を人間は聞き分けることができる。 この現象をカクテルパーティ効果という。 このことより、人間の聴覚は自然とICAを行っていると考えられる。 それぞれの成分をパラメタライズし推定を行っていたら日が暮れてしまう。

ニューラルネットワークは、 その名の通り脳機能に見られるいくつかの特性を、計算機上のシミュレーションによって表現することを目指した数学モデルである。 「カクテルパーティー効果」の例を見ると、 ICAを使ったCMB解析がすばやく行えるのも、納得がいく。

ではこれでCMB観測のforeground分離は解決だろうか? そうだとは思いたくないし、多分そうではないと思う。 具体的にコメントできないが。 自分の研究を進めるには、 ここをしっかりしないといけないんだと自覚。

他人の研究ばかり見ていると、 自分の手が動かない。 自分はきちんと準備をして、さぁはじめよう、というタイプ。 研究はいくら準備しても終わりが無い・・・。 なので、その辺はバランスを取って自分の作業も進めようと思うのでした。 ひぐらしが終わらないとか、らきすた見たいとか、電脳コイルも見たいとかいっている場合ではない

kagami.jpg


21日Fri.

大学から更新。 夏の学校の仕事が一杯一杯。 開催まであと10ヶ月あるんですが・・・。

今後の糧になるかとも思い始めて夏の学校関連の仕事ですが、 研究が疎かになってしまっては元も子もない。 研究第一です(確か、東北大学のスローガンだったような)。

係長である私が仕事をやりすぎだと思うのです。 あれもこれも雑務だと思うと、係長の仕事だと思うのですが、 それもきちんと分担するのが本当は良いのでしょう。 以後そうします。

研究が進みません、本当に大丈夫なのでしょうか?

nakanohito.jpg

ネコになりたい・・・。 ネコの(中の人)はいいよな気楽で。


24日Mon.

週末だれた。

HEALPixのC++ようライブラリが思いのほか優秀で、 いろんな機能がある。 マップから直ぐにC_lが計算できる。 ノイズの影響があるので、 この計算結果を直接CMBの解析には使えないが、 いろいろと便利に使えるかも。

P(s(C_l)|d)\propto\exp\left[ -\sum_p\frac{(d-s)^2}{2\sigma_p^2} \right] \exp\left[ -\sum_l\frac{(C_l - C_l^{\rm f})^2}{2\delta C_l^2}\right]

ただ問題が。 完全にOOPなクラス、テンプレートで書かれているために、 今の自分のスキルでは使い切れない。

一方C言語用はシンプルな機能しかないが、 簡単に使える。ファイルを読む分には困らない。

中間発表も真近いので、色々考えなければならないが、 C++を集中的にやるべきだろう。

syobon.jpg

25日Tue.

今日は、AKARIのdiffuse マップ作成に関して土井さんに仙台に来ていただいた。 やはり面と向かって、話し合うのが一番である。 TV or Skype会議では、私が慣れないせいもあるが、 なかなか意思の疎通がしにくい。

AKARI diffuseの現状、私の今後の作業について有意義な議論が出来た。 全天マップが修論に間に合わないのは明らかであるが、 ゴースト・クロストークの除去に関しては、載せることが出来るかもしれない。 これに関しては、サイエンティフィックな結果にはならないが。

修士論文のメインもそうであるが、 こういうことに関しても、思い立ってすぐ解析が出来るというのは、強みだと思う。 解析が出来るというのはツールが使える、言語を自在に操れることである。

自分としては今後はOOPが天文でも主体となる(つまりIDlやC++,Javaは?)、 と考えているのでそちらに精通していたい。 残念ながら、現在の私のC++はCに毛が生えた程度でしかない。 「偉い人はコードを書いている」、とGoogleの偉い人はいっていた、 がこれに習って、自分も日々コードを書き使いこなしたいものである。

議論終了後は、回転寿司ではない寿司屋に行った。 「一個」五百円とか書いてあるメニューがいっぱいあったが気にしない。 さすがに○十貫とかはいかなかったが、多分一番食べました。 私以外が、1,2?,0.5払っていたので、私は一体いくらご馳走になったのでしょうか?

皆様ご馳走様でした。

MCMCでフィッティングが必要な複雑な解析をした場合、 線形なモデルに比べてノイズのエスティメートに手がかかる。 天文学の場合モデルがいいことよりも、 きちんとノイズ(ノイズの伝播をきちんと追う)を見積もりことに重点を起これることがある。 現在のWMAPなんかはその例なのであろう(ILCはモンテカルロシミュレーションである程度制限がつく)。

実際のところ、非線形な複雑なモデルの場合ノイズは解析的に求まらないであろう。 そこで、MCMCのような方法を便利に使う必要があるのだろう。

rei.jpg

26日Wed.

512x512 fits image.

fitsccはpixelは0から1から?

primary_image.valu(alpha_pix,delta_pix)

でpixelの範囲はどうなっているのか?

primary_image.valu(0,0)  // OK?
primary_image.valu(512,512)  // OK?

cfitsioでは0から。

fits規約ではインデックス(ピクセル座標)表示は1-512?, 0-511?

ここを見ると、 512x512のイメージで計算式に出てくるp_1,p_2は1-512の範囲である。

x_n = {\rm CRVAL}_n + {\rm CDELT}_n \times (n-{\rm CRPIX}_n)

nが1-512の範囲であれば、CRPIXも1-512.

簡単なデータセットを作ってテスト。

buru.jpg

このブルトーザー昔作ったっけ・・・。


27日Thu.

{\rm CRPIX}=({\rm naxes}+1)/2

FITSの決まりではpixelの中心が基準だから。

{\rm CRVAL}=({\rm max}+{\rm min})/2

crpixと同じ(最大+最小)/2。

{\rm CDELT} = ({\rm max}-{\rm min})/({\rm naxes}-1)

i=1 pixelがmin, i=naxes pixelがmax.このときの幅がmax-min.

i=   (x-{\rm CRVAL})/{\rm CDELT} + {\rm CRPIX}

x=minのときi=1, x=maxのときi=naxes. 小数点が出た場合。例えばi=1.6. i=1,2,..n-1,nのpixelがカバーするレンジは[0.5-1.5),[1.5-2.5),..[n-1.5,n-0.5),[n-0.5,n+0.5)

四捨五入。

i=   (int)[ (x-{\rm CRVAL})/{\rm CDELT} + {\rm CRPIX} + 0.5 ]

インデックスは[1-n]だが、 代入するvectorは[0-(n-1)]

i--
pramary.value( alpha_pix, delta_pix) ;

も上記の通り。

明日から早起きします・・・。

soft.jpg

29日Sat.

データ解析の練習プログラム作成中。 一日千行が限界か。

Gibbs Samplerを使うと、 データ{\bf d}から条件付事後分布からのサンプルが可能である。

確率変数X_1,X_2,\dots,X_nが互いに独立で平均\mu分散&ninetex(\sigma^2);であるような正規分布に従うとする。 事前分布\mu\sim N(\mu_0,\sigma_0^2)\sigma^2\sim {\rm IG}(n_0/2,S_0/2)とすると、 条件付事後確率分布は、

P(\mu|\sigma^2,x)= N(\mu_1, \sigma^2_1);\qquad \sigma_1^{-2} = \sigma_0^{-2} + n\sigma^{-2}, \quad \mu_1 = \frac{ \sigma_0^{-2} \mu_0 + n \sigma^{-2} \hat{x}}{\sigma_0^{-2} + n\sigma^{-2}}

及び、

P(\sigma^2|\mu,x)={\rm IG}(n_1/2, S_1/2,\qquad m_1=n_0+n, \quad S_1=S_0 + \sum_{i=1}^n (x_i-\mu)^2 )

である。これより、 事後確率分布からの確率標本を得るためのGibbs samplerは

・・・・・

これは、 尤度(データ回帰)がGaussianであり、事前分布(C_l)がinverse Gamma functionで書けることから、 条件付分布がGaussian,inverse Gamma functionで書けることに起因する。 事後確率分布はGaussianであれば「解ける」用に思われるが、N_{\rm pix}\sim O(10^8)を越えるような行列の逆行列を求めるのは不可能である。

Gibbs samplerはライブラリ等で提供される分布に従って乱数を振ることができる場合、 簡単に利用することができる。 Gaussianに従う乱数は最も簡単に生成できる乱数の一つである。

Gibbs samplerはMCMCの枠組みでは、 メテロポリス・ヘイスティング(MH)法での採択確率が常に一の場合に対応する。 分布に従う乱数が簡単には生成できない分布のときに、 MH法が使われる。

Gibbs samplerが優れているのは明らかだが、

・・・・・・・・・・・

まだ理解しきってません・・・・・・・。

fat.jpg

焼肉食い放題に行った。 肉食った後のアイスが旨かった。 寒い時にこそアイスでしょう。 おかしいでしょう、という意見は却下。 そんなこという人嫌いです。