Archive for September, 2005

インテリジェントデザインについて

Posted by 向井 淳 on Thursday, 29 September, 2005
> >日々魚を蹴る >の >
> > 銀河ヒッチハイク・ガイドを読み返したばかりのせいか、ダグラス・アダムズの文章みたいに見えて笑けてきます。そう思えばほら、腹も立たない。 > > >というのは名言だと思いました。いやまあ、日本国内で本気で腹を立てている人はあまり数は多くないと思いますが。 >

完全にランダムなシャッフル再生とは何か

Posted by 向井 淳 on Thursday, 29 September, 2005
>MM/memo から >http://hotwired.goo.ne.jp/news/technology/story/20050928301.html > を読んで頭が痛くなった。常に均等にしか再生されないことのどこがランダムなんだ? 完全にランダムなんだったら、たとえば全てがアルバム順に再生されてもおかしくないのではないか。ていうかコンピュータ科学が専門の友人て、ごく基本的な組合せ論の話だと思うのだが気付かなかったのだろうか。 > >ごく簡単に、曲が全部で3000曲があって、その中に10曲構成のアルバムがあるとしよう。「近い」と認定されるには間に挟まれる曲数が3曲だとする。ある2曲が近づかない可能性はどれくらいか? という問題を考えてみる。 > >普通の場合は 3000 * 2999 * 2998 * .. * 2991 通りの組合せがある。間に3 曲挟んではいけないとすると1曲の周辺8曲が使えないので(本当は端でちょっと組合せ数が変わるが誤差の範囲として) 3000 * 2991 * .. * 2910 だ。 > >とすると確率は、 > >Prelude> product [2991,2982..2910] / product [2999,2998..2990]
0.862081479222749
> >となって、おおよそ14%(7回に1回くらいの割合)で「すくなくとも2曲が近くにある」現象が起きる。 > >この確率が少ないと思った人は、3000曲というのは、1つのアルバムが平均10 曲だとすると300枚のアルバムで構成されてるということを思い出そう。この確率が独立だとすると、全てのアルバムが近くにない確率は0.86の300乗で、笑っちゃうくらい低い数になる。もちろん、実際には確率は独立でないのでこんなことにはならないが、すくなくともほぼ毎回、すくなくとも同じアルバム中の2曲が「近く」にあるくらいのことは言えそうだと気付く。 > >もちろん、3曲が近くにある確率、4曲が近くにある確率……と考えると確率はどんどん下がっていくけれども、全構成で考えれば、やっぱり無視できないほどの確率にはなるように思える。計算していないけど。 > >それでも数回にいっぺんとかいったレベルに過ぎないかもしれないが、これに「人間は特別な場合の確率を高く感じる」という認知的な性質を組み合わせると「いつも iPod では同じアルバムが近くに来る」という認識が生まれることには何の不思議もない気がする。 > >ところで iPod で聴いていて、「おおこの次にこれが来るのか」という選曲の妙みたいなものを感じることも、ままある。これもほぼ同じ理由なのだろうけれど、それに加えて、曲が決まったときに人間が共通項を発見してしまっているだけだという気もする。本当にまったく無関係な曲を自分の iPod に入れているかという疑問もあるし、逆に全く何の関係もない曲が来るとそれはそれで面白く感じたりする。 > >とかく人間の感覚というのはアテにならないということでしかないと思う。 > >ちょっと追記: 「使えない領域」は重なる可能性があるから計算が間違ってることに気付いた。うーんこれは計算が面倒くさい。本筋を大きく変えるほどの差ではないと思うけど。具体的には14%でないにせよ7%よりは大きい確率で発生する気がする、なんとなく。 >

ウィルコム新機種!!

Posted by 向井 淳 on Tuesday, 27 September, 2005
>やーうれしい。何が嬉しいかといって、もう京セラの端末を使わなくて済むのがとても嬉しい。だって京ぽん、使いにくいんですもの。なんかこう、メニューの構成といい、細かな機能の遷移といい(なんであるキーがキャンセルになったり送信になったりするのだ!)、もっさりした動作といい、絶妙に使いにくさを演出してくれていた京セラ。これまでユーザの文句に耐えながらもよく頑張ってくれました。でも、もういいや。 > >てなわけでたぶん三洋のにするかなあと思っています。 NetFront の出来とか次第なんだけどね。あと、ようやくアホなモバイルWnnから脱却できると思っているのですが、 Advanced Wnn の出来ってどんなもんなんでしょうね。 >

リタといえば

Posted by 向井 淳 on Tuesday, 27 September, 2005
>アメリカの台風には人名がついていること、それは年初に先頭がaの名前から始まってアルファベット順であること、くらいはもはや常識だと思うのだが、たぶんあまり知られていないことに、名前は男女が交互に来ることになっている。昔は女性の名前のみが使われていたのだが、男女公平になるようにそうなったらしい。 > >しばらくずっと「カトリーナ(K)の次だからリタ(L)なのか」と思っていたのだけど、だからこれはおかしいのだ。それともカトリーナかリタは男性名なんだろーか。 > >で、どうなっているんだろう?と思っていたのだけど、そういえば昔、この話に日記で言及したことがあるのが残っていた→ >/~mukai/diary/0207a.html#10_1 > > >この時から名前リストのページは移っていて、 >http://www.aoml.noaa.gov/hrd/tcfaq/B2.html >にそのリストがある。 > >でまあ見ればわかるように、 Katrina の次は Lee であって Lita ではないのだった。でまあ「どうなってんだ?」と思ってずーっと下にくだっていくと Rita がある。 > >Rだったのか! > >という感じでびっくりした。 > >てなことをmixiで書いたらツッコミを入れられたのだが、付随して発生した「子供」の台風にも名前がついていったりするので、思いのほかたくさんの台風が発生したことになっているらしい。 >

サマータイムマシン・ブルース

Posted by 向井 淳 on Sunday, 25 September, 2005
>某所で鈴木力さんが書いてた「これはつまり究極超人あ〜るなのだ」という意見に同意だ。 > >まったくぐだぐだな具合の大学SF研、意味もなく本棚にある(けど誰も読んでいない)S-Fマガジン、写真部と部室の共有。 >
> >「SF、研究してる?」 >
> >「してるわけないじゃないですか(笑)」 > >
> >といった秀逸な台詞の数々。いや実にワカッテル。 > >タイムマシンSFとしては、綺麗にピースに嵌っていく感覚が楽しいのだけども、構成はむしろ非常にシンプルで、「よくできてます」という以上の好評は出しづらい。 > >他にも、いくらなんでも登場人物が馬鹿すぎるとか、パラドックス発生時の問題の説明が弱すぎるとか、難点がないかというとそういうこともない。 > >けれどもやっぱり、このSF研描写ですよ。部室は広すぎるし、写真部を追いやるなんてそんな権力考えられないし、いくらなんでもオセロはやらないだろうと思うけど、でもやっぱりこのSF研描写のぐだぐだ具合が秀逸すぎる。それと、未来のSF研がまったく進歩がないところとか、服装その他含めてまったく進歩していないので未来人がぜんぜん未来人に見えないので最初は誰も気付かないとか、そういう描写がすごく素晴しい。だからこの映画は田村クンが素晴しい映画だとも言えるかもしれない。 > >万人にはオススメしかねるけれども、SF研でないとしても、ああいう小数フマジメぐだぐだ文系サークルに属していたすべての人にオススメ……かもしれない。 >+2 > >

ほっとけないSFの貧しさ

Posted by 向井 淳 on Sunday, 25 September, 2005
>3日に1冊、SFの書籍が絶版になっています。知られていない、値段が高い、そんなことで。この状況を変えるには、お金ではなく、あなたの声が必要です。絶版をなくそう、という声を表すホワイトバンドを身につけてください。 > >……こないだの「アンサンブル」の例会で出たネタを書き下してみた。まあでもぶっちゃけあなたの声ではなくてお金が重要だよなー絶版には。 > >このネタの問題点は、こういうタイトルだと「SFというジャンルは実り豊かでない」という意味に取られてしまうことなのだが。 >

ドナ・アンドリューズ『恋するA・I探偵』

Posted by 向井 淳 on Friday, 23 September, 2005
>こんなのも読んでしまった(笑)。タイトルからしてアホっぽいが、表4の粗筋によれば、 >
> >健気でチャーミング、でもちょっと傷つきやすいチューリングは女の子型人工知能。ネットワーク上のあらゆるデータにアクセス可能な彼女は、顧客の検索を手助けするリサーチャーとして大人気だ。だがある日、彼女を作ったプログラマーのザックが突如失踪する。彼に密かな恋心を抱くチューリングは名作ミステリを読み読み探偵術を覚え、彼の行方を追いはじめるが……人気作家の新シリーズ第1弾。アガサ賞最優秀長編作品。 > > >ってちょっとまて、いま写してて気付いたがコレやっぱシリーズなんだ? しかもハヤカワは続刊を出す気マンマンなんだ? > >さて、この粗筋を読んでバカSFないしはバカミスを期待した皆さんは手をちょっと止めてほしい。別にバカじゃないからこれ。 > >主人公が人工知能だという設定と、それにともなう描写について、SFファンなら誰でも読むうちに自然発生的にいくらでも沸いてくる疑問にことごとく答えないのは、本書がSFではなくて普通のミステリであるということを理解して、気にしないようにしよう。そもそもこんなスゲー人工知能ができるのはいつの時代なのかとか、こんな人工知能いたらヤバくね?とか、社会はどう変わっちゃうんだろうとか、そういうことを気にしていてはいけない。SFじゃないんだし。 > >まあそれはいいのです。主人公が人工知能だという設定は、明朗快活な女の子、しかしアームチェア・ディテクティブ、という設定方針のためにあって、ただそのために奉仕されていて、そうであると了解すれば基本的にはどうでもいい。 > >ただ、それにしても話がつまらないのはどうにかしてほしかったのでした。 >-2 > > >そうそう、主人公の名前はチューリング・ホッパーというのですが、チューリングはともかくホッパーって誰、と思ったらグレース・ホッパーだったというのはちょっと驚きました。グレース・ホッパーってアメリカではそれなりに知られていたりするのか(日本ではあんまり知られてないよね)。 >

外薗昌也『わたしはあい』

Posted by 向井 淳 on Friday, 23 September, 2005
>しまった、きのうの感想に入れわすれてた。これについては、ちょっと言いたいことがある。 > >実は1巻を読んだとき、微妙に期待していた。一見おたくっぽい外装をまとっていても、実はハードなロボットSFをやってくれるんじゃないかと期待してたのだ。 > >んで2巻を読んでて頭を抱えてしまった。なにこれ。まずそもそもだな、記号着地してないなら人が動こうが動くまいがデータの洪水には何ら変わりないっつーかどんな処理をしてるんだというか、こう、うーん、なんだ? > >期待しすぎだという話もありますがね。 > >けっきょく「研究者っておたくっぽい人たくさんいるよね」というところ以外には見るべきところのないまんがだと思った。 >-1 > >

scbayes on qdbm の野望

Posted by 向井 淳 on Friday, 23 September, 2005
>scbayes がどうも最近もっさりしてきたような気がするので、なんとかしたい。なんか dbm ファイルもデカいしね。で、どうしたものだか、と思っていたのだが、 >qdbm > を使うというのはどうだろうと思いついた。 > >qdbm は gdbm より遥かに高速で、DBのサイズも小さいという話だ。しかも、 hovel という API があり、これは gdbm と全く同じ API で qdbm (depot)を扱うことができるというモノ。 gauche-gdbm にコイツを噛ませてみたら面白いんじゃね?と思ったわけです。 > >あーちなみに qdbm の gauche binding も普通にあるけど、これを試すとなると scbayes の方の改変もそれなりにあるように思えて面倒くさそうだったので省略した。 > >で、インストール時にいろいろあったが、とりあえずやってみた。 > ># GDBM版
% time scbayes --learn-spam ~/Maildir/.trash/cur
learn: 100% |oooooooooooooooooooooooooooooooooooooooooooo| Time: 00:01:28
flush: 100% |............................................| Time: 00:01:37
summary: 1,325 spam mails are learned in 125.39 sec. (10.57 mails/sec.)
scbayes --learn-spam ~/Maildir/.trash/cur 105.66s user 6.30s system 88% cpu 2:06.29 total
# QDBM版
% time scbayes --learn-spam ~/Maildir/.trash/cur
learn: 100% |oooooooooooooooooooooooooooooooooooooooooooo| Time: 00:01:28
flush: 100% |............................................| Time: 00:01:38
summary: 1,325 spam mails are learned in 126.37 sec. (10.48 mails/sec.)
scbayes --learn-spam ~/Maildir/.trash/cur 107.30s user 4.83s system 88% cpu 2:07.27 total
> >……変わってねぇッ! > >dbmのサイズはというと、 > >-rw-r--r-- 1 mukai local 231744 2005-09-23 23:46 digest.dbm
-rw-r--r-- 1 mukai local 128506 2005-09-23 23:38 digest.dbm.gdbm
-rw-r--r-- 1 mukai local 3716718 2005-09-23 23:46 token-table.dbm
-rw-r--r-- 1 mukai local 5818259 2005-09-23 23:38 token-table.dbm.gdbm
> >というように、 token-table の方は確かに小さくなっているが、 digest の方はむしろ大きくなっている。速度については、学習時にはdbmのアクセス速度があまり寄与しないという可能性もあるので留保するとして、これはどうだろう? > >と思ったけどまぁきっと qdbm の方がよいし面倒だからこのまんまにしよう、と思ってさらに手元のスパムを学習させようと思ったのだが……今度は digest.dbm が開けなくなった。 dpmgr で調べるとデータが壊れているという。そういえば qdbm は、きちんと close しないと壊れるという話だ。それだろうなぁ。とほほ、思わぬところで dbm の閉じ忘れを発見してしまった。 > >で、ちょいとハックしたらなんとかなった。しかし、ドキュメントによるとガベコレ時にクローズされることになっているのだが、これがうまく効いていないってことだろうなあ。コードを見ると確かにファイナライザで close しているはずだが……何故だろう? qdbm を hovel で使ったモノを gauche から使うという怪しいことをしているからだろうか。 > >ちなみに、壊れていよーがいまいが digest.dbm のサイズは変わらなかった。ありゃりゃ。なぜだ? dbmの特性が変だからなのかな。 digest.dbm はたぶん、メッセージの digest を保持して既に学習したかどうかのチェックだけをやっているのだろうし。 > >速度についてはさておき(実際のチェック時のDBアクセスが高速化されるかもしれないじゃないか)、 dbm が肥大化する問題については、一度しか出てこないマイナーな単語を削るとか、両方にあまりにも頻繁に登場する単語を削るとか、そういうアドホックな方法しかないような気がする。てことで、そういうツールを開発して、月一とかのペースで定期的に走らせるようにするかね。 >

金曜日記

Posted by 向井 淳 on Friday, 23 September, 2005
>今日は池袋ジュンクの桜庭一樹サイン会に行って本買ってサインもらって、それから渋谷に舞い戻って『サマータイムマシン・ブルース』を見てきた。 >