/Members/chinone/Diary

Diary March, 2008

 

04日Tue.

日曜日。おいコン? I上くんがいつになくハイテンションだった。 ごめんよ、俺仙台離れるかもしれないんだ・・・。

近頃たるんで朝も夜も遅い。 研究の方もなかなか進まないでいる。 学会までには新しい結果が出る予定なので、がんばりたいところだが。

近況。

CMBはシミュレーションデータから実際のWMAPデータへの以降。 データ作成は既に終わり、 そのデータを食わせる段階。 シミュレーション時には

  • 30GHz
  • 44GHz
  • 70GHz
  • 100GHz

だったが、これが

  • K band 23GHz
  • Ka band 33GHZ
  • Q band 41GHz
  • V band 61GHz
  • W band 94GHz

に変わる。手始めにKa, Q, V, Wの四バンドだけの置き換えをやったのだが・・・、 収束しない。 結果のマップを見ると、不思議な幾何学模様をしている。 以前にもこのような症状があった。 多分、foregroundの重み付けをいじっていたころだと記憶している。 foregroundの重み付けに失敗している予感。 日記にでも書いていれば・・・。 日記をきちんとつけていると、 こういったとき便利だと思う。 やはり日記は毎日欠かさずにつけるべき。

このときはいつの間にか解決していたが。

日記書きながら重みをいじっていいたら収束した! 結果を見るとSynchrotronな成分は引けているが、thermal dust、 つまりスペクトルが右上がりの成分が引けていない当然の結果を得た。

その後は、free-free, thermal dustも付け加えたいところだが。 二つともtemplateを使うことになるので、 サイコロを振るべきはtemplateの倍率のみ。 既存のプログラムを少しいじるだけで実現したいところ。

あかりは簡単な(限定的な)PSF導出になる予想。 スキャンの角度によって角度(角度だけが)が違うPSF(+source)になるので、 スキャン角度分回転させて積算すれば、SNが稼げる。 問題は回転の中心の取り方。 これは他のメンバーが測定した値を使った。

因みに、この像からソースの情報は得られない。 ソースの構造はスキャンによらず同じであるが、 回転させて足し合わせているので、 ソースの構造は失われる。 残るのはPSF(の特徴的なパターン)。 ここではひし形のようなもの。

それなりの絵は出来たと思う。 後はこれをどのように調理するか。 点源観測がないので、今回得られた絵からPSFとsourceを分離するためにはblind convolutionが必要。 でも、今までの議論から言って難しいと考えられる。 よって、今回得られた絵を、この解像度(より悪い範囲での)PSFと扱うのが現実的?

それぞれのposition_angleで得られた絵に、今回の絵をPSFとしてdeconvolutionして得られる絵は、 sourceになるのだろうか?

身辺。

書類を送った。来年度は東北大学にいないかもしれない。

iPod classic 160GBを買った。 iPodサイコー。

音質に不安があったが、自分は問題ないと感じた。 ただし、

で触れられているように、

  • 高音域でのわずかな上昇(高周波が強調される)
  • 周波数に応じた群遅延(音像の立体感のぼやけ)
  • 相互変調ひずみを引き起こす、周波数22.1kHzでの強い変調(音がひずむ)

の特徴が自分の耳でもなんとなく確認できた。

写真、Video、テキスト(青空文庫を落として小説が読める)を詰め込めるので、 色々遊べそうです。

研究用にワイヤレスマウス・キーボード、 趣味様にワイヤレスマウスを買った。 まだ活躍の場はない。

「所詮、『忙しさ』なんてその程度のものだ」

05日Wed.

作業は進んでいるが、規則正しい生活が出来ていない。 朝起きる意思が・・・。

大学に行くのが遅くなると、就寝時間が遅くなる。 近頃はO倉さんの車で帰宅している為、 帰る時間は何時もほぼ同じだが、 帰宅後家で作業をしてしまい(よくないことに、自分の場合家での作業は大学のそれに比べ効率が悪い)、 結局寝るのが遅くなる。 そしてはじめに戻る。

こんなことは社会人の方々には到底まねの出来ない芸当だろう。

この日記を遡れば分かるが、 自分はこんなことばかりやっている。 この問題の最も効果的で唯一の解決策は、

  • 早く寝る
  • 二度寝しない そして、
  • 眠たくなったら眠り、必ず同じ時間に起きる

に尽きる。

06日Thu.

11時出勤。 以前よりはマシ

修士論文をどうにかこうにかして投稿論文にしようかと思案中。 学会は学会。 学会には「分かりやすい」結果を提示する必要がある。 なので、急ピッチで実データに移行中。 実際はシミュレーションで確認すべきところはまだある。 なので二束わらじで活動中。

あかりも(自分の仕事が)ここにきて進み始めた。 結果を考察しながら裏では条件を変えた解析をゴリゴリまわす日々(一回の解析に6GBほどのファイルを読む)。 HDDが飛ばないか心配です。

今日もこんな感じで作業を進めていたのだが、 休憩しているときにRSSをチェックしたところ、 なんとWMAP five-yearの結果が出ていた!?

早速LAMBDAのサイトに行ってぱらぱらと論文を見る。 自分に特に関係する

を印刷、現在読んでます。

foregroundの解析にMCMCが出てきたり、 Clの計算にsampling basedな手法が出てきたりと自分の研究に大いに関係していて喜ばしいです。 この方向なのだと。 宇宙論的結果の論文についてはまだ見ていませんが、 主著が小松さんになってますね、これ。 すごいですね本当に・・・。

3-yearのときは一ヶ月以上かけてみっちり読んだ。 そのおかげで周囲の誰よりもWMAPのデータ解析については詳しいつもりだ。 (そもそも、データ解析について詳しい必要はなく、結果だけが大事だと普通は考えているわけで。 Clの計算がlarge-scaleとsmall-scaleで計算方法が違う、とかは普通は認識していないわけで。) 今回もじっくり読んでみるつもりだ。

あと、大学院博士課程後期の合格通知が届いた。 受験番号が****3になっていた。 I上君と俺とうわさのニュートリノの方だろうか?

07日Fri.

今日も11時出勤。

WMAP Five-YearのTTの結果をプロットしてみた:

Cl_3_5-year_l02-50.png
Cl_3_5-year_l02-50yerr.png

large-scaleの挙動はl=2は外れたまま、 l=5も外れている。l=7は外れたままで悪化している。 l=22は外れているが改善。 l=28は外れているのが、どうにか中へ。 l=32は外れているが改善。 l=35,37は外れたまま。 l=38は中だったのが外へ。 大きく外れているl=40は外だが改善。 l=45,46は外が中へ。 l=47は中が外。 l=48はそとで変化なし。

観測点のすべてがベストなモデル(の1-sigma)に入るのが尤もらしいが、 そもそも我々の宇宙のあるlが確率的に外れていれば、中・外と議論する意味はないわけで。 今までの結果を見る限りl=2は外れているのだろう。

Cl_3_5-year_l0002-1000.png
Cl_3_5-year_l0002-1000yerr.png

l=100以降で若干大きくなっている。 その結果best fits ΛCDMモデルの振幅も大きくなっている。 これによる宇宙論パラメータへの影響は?

それ以降のsmall-scaleではノイズが減少している。 観測回数が増加した効果。 結構値も変わっている。

観測回数が増えたことで、 cosmic varianceが十分小さいところでのノイズは、 観測回数のルートに反比例し、 小さくなる。

値の変化(1-sigma以上に変化しているものもある。システマティック?)は解析手法の変化だと思われる。 まだよく読んでいないので現段階ではこれ以上のことは分からない。

宇宙論パラメータの変化:

  • Five-year
    lcdm_sz_lens_wmap5_v3.png
  • Three-year
    3_lcdm_wmap_v2p2.png

結構変わってます。

08日Sat.

今日は大学に行っただけになってしまった。

WMAP five-yearとthree-yearの結果が若干変化しているのだが、 原因は使ったマスクの変化(改善)によるもの? じっくり読む時間がまだ無い。

時間が無いといいつつ、趣味の話。 iPod classicを買ったのだが、 イヤホン・ヘッドフォンも欲しくなってきた。 今は、ATH-PRO5というヘッドフォンを使ってる。 大体7000円ぐらいの。 この価格帯で低音重視の人間にはベストなヘッドフォン。 原音を歪めて低音バリバリ、そんなヘッドフォン。 人によっては「気持ち悪い」と感じるほど。 HMVの視聴用にこれのOEMで、ユニット(振動板)が違うのが置いてあります。 若干音が変わるらしいが基本的には低音がよく出るらしい。

音として問題ないのだが、如何せんガワが大きい。 これつけて通学していると目立つ。 そこで、カナルタイプのイヤフォンが欲しいな、と。 一万円以下でコストパフォーマンスの優れるもの、 もしくは低音重視のものを物色しています。

取り敢えずのメモ:

価格別カナル型イヤホン(B:バランスド・アーマチュア、D:ダイナミック) 
ZEN AURVANA (B) 10,000円以下で購入できるカナル型では一番良いと思う。
E2C/E2C-N/E2G/SCL2 (D) シカゴ・イノベーション・アワード最優秀賞
EMP2 (D) 1万円以下で、この機種が1番良いと言う人の気持ちも分かる。
DTX50 (D) とにかく面白い機種です。
SHE9500 (D) 音質は明らかに価格以上。1万円前後の機種にも対抗できそう。
SHE9700  全般的にこの価格としてはかなりレベルが高い。
HP-FX77 (D) かなり低音寄りな音。
KEB/24・音質は価格より少し上。4,000円〜5,000円レベル。
      ・低音域が相当強い。頭を殴られているような感覚に陥る。
CX300 音質そのものは価格より少し上。OEMには他に、CreativeのEP-630やシャープのHP-MD33がある。
DENON AH-C350「CX300」と並ぶ5,000円以下の代表。CX300では高音域が足りない人へ。

■カナル型:
フラット・CP重視:SHE9500(9501)(PHILIPS)
弱ドンシャリ:MDR-EX85SL(ソニー)、HP-FX55・HP-FX33(ビクター)、EP-630(Creative)
EP-630 俺もFX-77持ちだが、ほぼすべてにおいてこちらの方が上だと思う。 

高音寄り:ATH-CK5(audio-technica)、ATH-CK31/32(audio-technica)、RP-HJE50(パナソニック)
低音寄り:HP-FX77(ビクター)

!!地雷!!:ATH-CK51/52(audio-technica)

09日Sun.

思うように作業が進まないですね。 foreground解析でのCMBとForegroundの重みのとり方について。

自分の解析は、ForegroundにPriorを入れないと、 上手く収束しないのは今までもその通り。 Five-yearの解析(galactic foregroundの解析)は入れなくても収束しているのだろうか? histogram、2D contourでは分布が綺麗には見えない。 chain数は数千のオーダーではないし。

今週は明日と明後日しか作業できない。

AKARIは新しい位置計算法だとずれるし、 なんか変な特徴があ現れた・・・。

10日Mon.

今日は授業料の引き落とし口座を変更するために七十七銀行本店へ。 七十七銀行本店で何時も思うのだが、行員の方々の対応が良い。 「良い」というよりは、サービス業としても自覚がある、といった方がいいかもしれない。

普段銀行にはめったに行かないので、 色々とある窓口のうち自分が行くべきところが分からない。 折角並んで窓口にたどり着いたと思ったら、 「ここでは扱っていません。向こうに並びなおしてください。」と言われるのはいやだ。 なのですべての窓口の案内説明を確認してから、 最も最適だと思われるところに並ぶのが、ベストな解(案内の人にはじめから聞くのが一番ではあるのだが・・・)。

で、フロアをウロウロしていたら声をかけられた。 どこの窓口に行くべきか教えてもらった。 この声をかけた人は、おそらくは「声かけ専門」の人。 自分のようにウロウロしている人間を見つけ、声をかけて案内する役割の人だと思う。

その声かけ係の方に「さらっと」書類を見せて、 窓口を案内してもらった。 その方は「さらっと」見ただけの書類から名前を見つけ、 「茅根様のご用件でしたら・・・」と名前を呼んでいた。 出来るな、と思った(読み仮名は書いてあった。今度やるときは読み仮名書かない状態で持っていこう)。

こういった事務手続きは大学でもしばしばある。 出張の手続き、 TAの手続き、 奨学金の申請手続き、 etc.

これらの手続きをするときに何時も思うことは、 事務方の不手際、 面倒・不都合を学生・研究者の側に負担させている、ということ。 事務方の作業が軽減するようにして、研究者・学生にしわ寄せがくる。 大学の事務の対応の悪さ(誤解されないように言っておくと、 大学事務すべての対応が悪い、と行っているわけではない。 きちんとしている人「も」いる。)をどうにかしてほしい。 窓口業務、事務手続きはサービス業だという自覚をもってほしい。

(窓口業務としては七十七銀行の対応が「普通」なのかもしれない。)


下界に降りたついでに、ヘッドフォンを買ってきた。 以前の日記に書いたようにカナル型を。

一万円以下の評判の製品をピックアップしたのだが、 無意味でした。 KH-C701(Etymotic社のER6/ER6iのOEM)を買いました。

▼〜20,000円 
ATH-CK9 (B) 
ER-6/ER-6i/KH-C701 (B)   <<これ
ep720/ep730 (B) 
RH-IE3(D) 
E3C/E3C-N/E3G/SCL3 (B) 
SE210 (B) 
Super.fi 3studio (B) 
UHP336 (B) 
HP-FX500 (D) 
AH-C700 (D) 

価格は14980円です。ですがなぜか、4980円で叩き売られてた。 仙台のヨドバシです。 現品限り。残り二つでした。

じっくり聞いていないので、音質の評価は出来ませんが、 web上の情報を見る限り値段相応の音質だそうです

外ではこれを主に使うことになりそうです。

CMB component separation and the physics of foregroundsという研究会があるらしい。 是非行きたい! 財源は・・・。

11日Tue.

しょぼーん(´・ω・`)

14日Fri.

12,13,14と高エネルギー加速器研究機構(KEK)で開催されたAIU08に参加してきた。 AIU08は

KEK Cosmophysics Group Inaugural Conference
Accelerators in the Universe
- Interplay between High Energy Physics and Cosmophysics -

の通り、KEKの宇宙論グループ立ち上げ・お披露目研究会である。

研究グループのスタッフは理論が児玉・井岡の両氏、実験が羽澄さんとなっている。 今回の研究会の内容も、概ねこれらの方の専門を中心としたものだったと思う。 羽澄さんのグループが立ち上がったことが、個人的にはもっとも興味深い。

まぁぶっちゃけ、二日目の羽澄さんのtalk 「Jumping into CMB polarization measurements ? a new group at KEK ?」 の最後の方に、大学院生が六月から来る、と書いてあったのは自分です。 ということで、私茅根は(おそらく)今年の六月で東北大学を去り、 羽澄さんのグループにKEKへの受託という形で移ります。 手続き上は四月から受託ですが、 東北大で色々(修士論文を投稿論文にする、AKARIの作業をまとめる。飛ぶ鳥跡を濁さず・・・身辺整理)とやることがまだありますので、 少し猶予をとることにした。 (手続きの書類は提出済みなので、後は事務側の処理だけだと思われる。問題がなければ。)

羽澄さんのグループではQUIETに参加することが決まっている(リンク先のwebページの「Team」に既にKEKの名前があります。)。 自分はここでデータに触ることになります。 QUIETグループの本拠地であるシカゴ大学に行く機会もあるかもしれません。

QUIETは今年の夏からphase Iのデータが出始める。 このデータをを使って三年後に東北大学でドクターをとる予定。 あくまで受託ですので、学籍は東北大学です。 QUIETはphaseIとIIがあり、うまくいけば楽観的な推定でB-modeが受かるかも、といわれている。

CMBの観測に携りたくて服部研究室を選んだわけだが、 これから自分がドクターをとるまでに服部研でCMBの観測を行なうのは現実的に不可能である。 その先は不明。今もっとも確実な選択をした。データに触ることが出来、自分の手で解析、科学的な結果が出せる状況がそこにはある。 東北大学での修士時代は無駄ではなかったが(修士時代の研究は実験とは無関係)、これからを考え決断した。


羽澄さんはQUIETへの参加を足がかりにし(PolarBeaRとも連携するとか何とか。ここの教授であるAdrian T. LeeがAIU08に来ていた。挨拶だけした。)、 CMB polarization観測のノウハウ蓄積、 将来の日本での計画実現を目指している。

日本でようやくCMBの観測の機運が高まってきた。 電波業界、国立天文台、理論の方々を巻き込み本格的に始動する兆しも見えてきた。 CMBにそれほど興味のない方々も含めて色々と思惑が錯綜しているらしいが(私はしがない大学院生、何も知りません)、

是非とも日本でのCMB観測を成功させたいものである。

そのとき自分が何をしているか・・・。 自分も何らかの形で貢献していたい。


研究会で感じたこと。 研究の内容は当然大事だが、英語やコミュニケーションもまた重要である。 英語でtalkをするのは当然だが。 英語で議論するのも当然。 つまり英語(プレゼン・会話)をどうにかする必要がある。

バンケットやレセプションで人見知りしない・会話がうまい人は得をするな、と感じた。 今回バンケットやレセプションでしゃべったのは、以前からの知り合いと服部先生経由だけ、という寂しい状況。 食べたり呑んだりするのが主の目的ではなく、いろんな人としゃべるべきなのですが・・・。 小玉さんが用意したらしい肉(初日も二日目(鹿?)も)とワインはおいしく頂いたのですが・・・。

コミュニケーション能力。これは個人の性格の問題もあるのでなんともいえないが、 自分は誰でも何でもいつでも話せる人間ではない。気苦労は増える一方です。


最後に

KEKのロゴ

logo.gif

と仙台市清掃公社のロゴ

kousya.png

とが(なんとなく)似ている。

15日Sat.

good night!

16日Sun.

頻度主義ではデータの当てはまりのよさ、物理的な予言のよさをreduced-chisqではかることができる。 一般にパラメータの数を増やすと、reduced-chisqはよりよい方向に遷移する。 つまり、reduced-chisqからは自由なパラメータの数を決めることが出来ない。

p(\theta|d,{\cal M}) \propto p(d|\theta,{\cal M}) p(\theta|{\cal M}) ,\qquad  p(\theta|d,{\cal M}) \propto {\cal L}(\theta) \pi(\theta)
モデルの「良さ」、model comparison
marginal likelihood (周辺尤度、evidence、likelihood of the model)is the fundemental quantity for model comparison:
p(d|{\cal M})  = \int d\theta \, {\cal L}(\theta)\pi(\theta)
priorも考える。prior(外部の観測、理論的な予言)もしモデルの事前分布に優劣がなく、 全てのモデルが同等に考えられるのであれば、
p({\cal M}|d) \propto p(d|{\cal M})
である。よって、
\frac{p({\cal M}_1|d)}{p({\cal M}_2|d)} = \frac{p(d|{\cal M}_1)}{p(d|{\cal M}_2)} = B_{12}
となる。B_{12}をBayes factorと呼ぶ。 このmarginal likelihood(bayes factor)を使うことで、 モデルの比較ができる。
複雑さ、complexity、自由度
complexity、複雑さはデータから図られるべきである。複雑さはデータが知っている。 モデルのfree parametersの数はもっとも単純な複雑さ(complexity)の指標である。 そのデータを説明するのもっともよく説明するパラメータの数はいくつか?
Bayesian Complexity
which measures the number of model parameters that the data can constrain:
{\cal C}_b = -2 (   D_{\rm KL}(p,\pi) -\hat{D}_{\rm KL}  )
右辺のD_{\rm KL}(p,\pi)はKullback-Leibler(KL) divergenceと呼ばれる量である:
D_{\rm KL}(p,\pi)  = \int p(\theta|d) \log \frac{p(\theta|d)}{\pi(\theta)} d\theta
カルバック-ライブラーダイバージェンスは二つの分布の間のエントロピーの測度である。 この式とBayesの公式から、
{\cal C}_b = -2 \int p(\theta |d,{\cal M}) \log {\cal L}(\theta) + 2 \log {\cal L}(\hat{\theta})
を得る。この式からeffective chisqを定義できる。 上式の右辺の最終項は、推定値でのchisqに他ならない。 また右辺の最初の項は、事後分布で平均したchisqである。 この二項の差からeffective number of parametersを定義することができる:
{\cal C}_b = \bar{ \chi^2(\theta)} - \chi^2(\hat{\theta})

model comparison and complexity

モデルの選択をbayesianによるmodel comparisonで行なう。周辺尤度を計算すれば良いのである。 KL divergence、つまりはeffective chi-sqから自由度が見積もられる。

  1. mode A and model B.
  2. n_B > n_A
  3. p(d|B)  \gg p(d|A)の場合、Bが選ばれる。
  4. p(d|B)  \approx  p(d|A), \quad {\cal C}_b(B) > {\cal C}_b(A)の場合、 モデルのよさは同等程度であるのでどちらでもよいように思えるが、有効パラメータの数が小さい方が「よい」と考えられる。 よってAが選ばれる。
  5. p(d|B)  \approx  p(d|A), \quad {\cal C}_b(B) \approx {\cal C}_b(A)の場合、 モデル同士に優劣はつけることが出来ず、パラメータを増やすことに積極的な理由はない。 あえてBを選ぶ理由がない。よってAが選ばれる。

結局どうするのか?

データ解析の良し悪しに使われるのは依然としてreduced-chisqである。 (一部宇宙論の論文等でevidence、BIC、AICが出てくるが。WMAP Five-yearを見ると、MCMCを積極的に使っていたり、 priorを考えていたりと「進展」している。しかし、abstructや結論にはやはりchisqの値が載せられており、 この値をもって解析の良し悪しを議論している。)

MCMC(事前情報も考えられる)を実行。 周辺尤度を使いモデルの良し悪しを判断する。 推定値はMCMCからMAP推定を行う。誤差推定も然り。

また、effective numbers of parametersから自由度を計算し、 reduced-chisqの値を得る。これから、p-valueを計算する。 これを提示(広く使われている枠組みだから。 確認しておくと、モデルの選択自体はp値では行わず、周辺尤度で行う。 p値はあくまでも広く使われている枠組みであるから提示しているのであって、 個人的にはそれをもとに積極的な主張をするつもりはない。 むしろ周辺尤度で積極的な主張をしたい。)。


おさらい。p-valueの意味(と仮説検定の意味)

p = \int_{\chi^2}^\infty f(z,n_d)dz

where f(z,n_d) is the chisq pdf and n_d is the appropriate number of degree of freedom. chisqは自由度と同じ程度だと「reasonable」であると言える。

(単純な)式の意味
あるモデルで推定したパラメータによるchisqよりも悪くなる確率。

統計学的仮説検定は,

・ほんとに示したいこととは反対のことを帰無仮説として考える.

・データを集める.

・データと帰無仮説からp 値を計算する.

・p 値にもとづいて帰無仮説を評価する

というふうに進める.

p の値がじゅうぶん小さかったら,帰無仮説が棄却された → ほんとに示したい ことが示された,と論を進める

仮説検定では、棄却されて意味のある=無に帰すべき仮説を考える。これが帰無仮説。 よって帰無仮説はほんとに示したいこととは反対のことを言わなければならない。

ここに登場するp 値は,

・得られたデータが偶然の結果である可能性を示す.

・1 - p が,得られたデータの確かさ(同じ実験や調査をしたときに同様の結果が得られるか)を示す.

・帰無仮説が正しい可能性を示す.

などと解釈されるが,これはどれも間違い.

正しくは, 「帰無仮説が正しく,かつ想定する統計モデルが正しく,データがランダムにとられている場合に,観測データ+'もっと極端な'データが得られる確率」を示す。

以上参考(The Insignificance of Statistical Significance Testing,統計学的な有意性検定の意味のなさ)


観測的宇宙論のようなデータ解析では、

・ほんとに示したいこととは反対のことを帰無仮説として考える.

ではなく、本当に示したいモデルを仮説にし、データと仮説(本当に示したいモデル)からp 値を計算する.

p の値がじゅうぶん小さかったら,帰無仮説が棄却された → ほんとに示したい ことが示された,と論を進める

ではなく「pの値が十分おおきく、仮説を棄却できない ⇒ 仮説(考えているモデル)が正しい」と論を進める。 このときp値は「仮説(考えているモデル)が正しく、かつ想定する統計モデル(ノイズをガウス分布だと仮定すればガウス分布)が正しく,データがランダムにとられている場合に,観測データ(+極端なデータ)が得られる確率」」を示す。

仮説は「あるCMB+Foreground分離モデル」でそのときのp-valueは「あるCMB+Foreground分離モデル」が正しい確率。

17日Mon.

3月も中旬を過ぎた。 多くのM2はすでに仙台を離れているとか。 あの飲み会が最後だった人もいる。 卒業式のときに来る人もいるらしいが、 残念ながら私が学会で仙台にいない。 もう会えないかと思うと、さびしいです。

一方、明日はH研の新M1の方が東北大学に来る。 H先生が出張中なので、私が相手をすることに。 学習院の方らしいので、いろいろと想像が膨らみます(今現在皇族で学習院大学に行っている方はいるのだろうか?)。

ついでに、明日は私の博士課程後期の進学手続きの日でもある。 書類は既に準備してあるので、すぐ終わるつもりでいるがどうなるでしょうか?

今日は、年度の移り変わりを感じさせるそんな一日だった。

・・・

そろそろ学会のトラペを作らなければ。 昨日書いたことを上手くいれて、皆に納得してもらえるようにがんばる。 その為には新たにコードを書く必要があるんで、急ぎましょう。

2007062705_4124730746.jpg

18日Tue.

博士課程後期のへの入学手続きを無事終了。 これで四月から無事進学できます。

来年度のD1は二名のようです。 +αはなかったようです。

2004071713.jpg

19日Wed.

大遅刻。

effective reduced chisqの計算が上手くいっていない。

問題:

  • spectral indexにpriorを入れないと(上手く)収束しない。収束はするが分布が汚い。 負に発散する方向に働く。この結果averaged chisqの計算がおかしくなる。
  • 上の結果(averaged chisq)-(MAP chisq)が負になってしまうpixelが存在する。
  • 各pixelで計算するのではなくpixel全部の和をとった場合でも、priorを入れておかないと負になる。
  • priorを入れてpixel全部で和を取って計算した場合、負でない値を得る。 しかしその値は\chi_\nu^2 = 0.5といったような値である。 個人的には問題ない(後述)と思うが、皆さんは許してくれないと思う。

解析の制限(priorを考えない。非線形パラメータ・縮退が激しい)から分布が汚くなる、 例えば上で書いたようにspectral indexの分布が負に発散するようになることがある。 この結果を受けて、推定値も負の方向に広がったものになる。 つまり、物理的にありえないようなspectral indexが実現する確率がゼロではない結果になる。 この結果に意味があるのか?

priorを入れ、spectral indexのとる範囲を制限したとする。 物理的にはありえない範囲の値をとることなく分布が収束する。 このときの推定値は、priorを考えない場合と異なる。

前者と後者、どちらを推定値とするべきか?

前者のchisqを考える。 spectral indexの分布は汚いかもしれないが、実のところchisqは壱くになる。 これは分布が汚くなるようなpixelはそもそもSNが悪く、 たとえspectral indexが負に発散しても、データの回帰自体にはさほど影響を及ぼさないからである。

一方後者のchisqについて考える。 前者のchisqが壱近くであることは既に書いた。 分布が汚くても壱程度の値をとるのだから、 分布が綺麗であるぶんさらに値が改善することが期待される。 結果もそうなる。つまり壱をきるようなことが起こりうる。 これは当然と言えば当然である。 大きく間違っていないモデルを仮定しているのであれば、非線形・縮退していてよい推定が出来るだろう。 そのモデルに加えてpriorを考えるのだから、縮退が解けたり・推定値がより真の値に近づいたり、 推定値の分散がノイズレベルよりも小さくなったりすることが起きてもおかしくない。

chisqを主に考える(現在の)解析ではこの結果は受け入れられない。 「あいすぎる」というのが理由である。


chisqだけで解析の良し悪しを判断する理由も分かる。 「解析は得られたデータから主観を排して行うべき。」だと。 唯一、データの回帰、つまりchisq(chisqを計算するためには、当然観測を説明するモデル(数式)が必要になる。 これだけは仮定する)だけが客観的な基準であると。

chisq以外に解析の良し悪しを判断する値が存在すればいいわけである。 それが周辺尤度、evidenceと呼ばれる値。 chisqの値は周辺尤度、evidenceの特別な場合(priorが一様)と考えることが出来る。 周辺尤度はモデルの事前分布がすべてのモデルについて同じであれば、 データが与えられたときのモデルの確率である:

P(d|{\cal M}) \propto P({\cal M}|d)

データだけによる値という意味(当然解析するデータモデルにはよる。そのデータモデルの確率を計算しているのだから)で客観的な判断基準である。


すごすぎる・・・、けど中に小さい人が二人入っているようにしか見えない・・・。 氷の上で転びそうになったときに体制を立て直す仕草は人間そのものの様に見えた。

20日Thu.

世間は休日。でも9時出勤。

・・・

自分でつくった2D FFTのライブラリにバグがある可能性が出てきた。 急いで直す必要がある。 いい機会なので、外部のライブラリを使うつもり。 FFTWを落としてmake。 FFTをすべて置き換える。

21日Fri.

ここ一、二ヶ月ノートパソコン(科研費)のバッテリーの調子が悪い。 バッテリーの充電率がある一定以上に上がらなくなった。 はじめは確か74%だった。 筐体にあるバッテリー充電中を示すLEDが点きっぱなし。 リチウム(イオン)バッテリの充電制御回路がいかれて、 充電済みにもかかわらず過充電しているのでは、と考えBIOSに付属しているバッテリリフレッシュユーティリティを実行した。 バッテリを完全に空にして再充電、 今度は64%以上にならなくなってしまった。 よく分からないことに、 ACアダプタを数秒外し、 すぐに付け直すと少し時間がたった後に1%だけ回復するといった症状も見られた。

バッテリからの発熱がないので、いきなり爆発!なんてことはないと思うが、 ものがもの(リチウムイオンバッテリ)なだけに少し心配(念のためにいっておくと、 昨今のリチウムイオンバッテリの不具合報道等のことではない。 リチウムイオンバッテリは取り扱いを誤れば危険なものであるという、常識的な判断。)。

来週は学会なので、今の状況でどうにか乗り切らなければならない。 学会から帰ってきたら修理に出そうと思う。

この文章を書いているときに、 ささっと調べたところ上記の不具合はこのノートパソコンではよくあることだそうだ。 対応もスムーズらしいのでさっさと修理してしまおう。

問題は・・・費用。 一年保障は終わっている。 でも三年間の部品保障はまだ残っている (と思う。このノートパソコンの発売日が2005年 3月 1日。購入したのは発売日当日ってことはないと思うので・・・)。 明日中に連絡をとってみるのが吉。

22日Sat.

今日は何も出来なかった!

23日Sun.

大学から帰る足がなくなったので、 徹夜していました。 その甲斐もあってトラペは完成しました。 物自体は出来ていたのですが、いかに枚数を減らすかが問題でした。 明日からは学会です。

明日は、この間から運行が始まった「はやて100号」で早いところ東京に行ってしまう予定です。

27日Thu.

学会終了。 二日目に発表(前日は夏の学校関連で28時頃まで飲んでいました。 自分の発表は翌日の10:30。死ぬ気で起きました。 直前まで頭が痛かったが、発表中は痛みが消えていた。)。 無事終了させました。 大きな失敗もなく、無難にこなせたと思う。

質問も想像以上にあったし、アドバイス・コメントもいただけた。 興味を持っていただいた方とは、個別に議論する機会も持つことが出来た。 「まだ論文になっていないのか?」といった類のことを言われた。 論文にするレベルに達している、と判断してもらえたのだと思うと素直にうれしい。 なので、さっさと論文にしたいと思う。 タイムリミットは六月。 アクセプトまでは無理かもしれないが、 投稿まではたどり着きたい。

東京から仙台に直接帰るのではなく、実家によっている。 およそ壱年ぶりの帰省。 おそらく31日に帰仙する予定。