Archive for July, 2006

街惨麹とは何か

Posted by 向井 淳 on Monday, 31 July, 2006
>ゆえあって Windows をちょっと使っていて、必要なので Poderosa をインストールして使っているのだが、時々謎の「街惨麹」という文字が入る。何なんだこれは。 > >何なんだというか理由はわかっていて、端末操作関係の文字がうまく処理できなくて化けているんじゃないかという感じ。雰囲気的には、文字色か何かを変えるときに出てくるっぽい感じで、 SKK の変換とかが大変なことになっちゃってます。 > >いちおう、心の目で見れば見えないことはないのだが、さすがにしんどい。どの辺の設定を見直せばいいのだろうか。 >

SuperCon 2006 開幕

Posted by 向井 淳 on Monday, 31 July, 2006
> >http://slashdot.jp/article.pl?sid=06/07/31/0527254 > 私はこの第二回に参加したことがあります。まあ、先輩のお共だったんですが。んで翌年は自分でコード書いたけどあえなく落選しました。今となっては良い思い出……でもないな。当時のオレをひっぱたいてもっとちゃんとプログラミングせいと言いたくなるわい。まったくもう。 > >まあ、それはともかく、あれのおかげで東工大というのは良い大学なのではないか、と思って、高校時代は志望校のひとつでした。まあ、大学受験そのものがメンドくさくなったので、けっきょく受験しなかったんですが(今の大学は推薦入学)。大学としては、こういうイベントをやるといいよねーと思います。 > >話を変えて、スラドの読者層というのはもっと若いのではないかと思っていたけど、私と同世代な人もけっこういるのだな。といってもこのストーリーへの書き込みも少ないから、これが一般的な層なのかどうかは知らんけど。 >

はてなのメモ

Posted by 向井 淳 on Saturday, 29 July, 2006
>はてな日記は、 HEAD リクエストを出すと last-modified フィールドが出てくるが、 GET リクエストのときには出てこない。 If-Modified-Since をリクエストヘッダに入れても、 HEAD のときはうまく処理するが GET のときは処理できない。何故? > >一見、似たよーなもののように見えるはてなグループでは、 last-modified まわりの処理がそもそも出来てない。 >

Rgrey の威力

Posted by 向井 淳 on Friday, 28 July, 2006
>一週間ほど前から大学の方のメールサーバに >S25R > を適用し、数日前には jmuk.org のには >Rgrey > を適用して運用している。これがすこぶる快適で、現状ほとんどすべてのスパムの排除に成功している。 > >どれくらい排除できているかというと、 Rgrey 適用でスパムが日に数件というレベルに激減したので、ベイジアンフィルタを切ってしまった。大学の方はほんとにすっぱり消えてしまったが、やっぱり S25R では届かないメールとかもあるらしい。 Rgrey にするのはそれほど手間ではないのだが、いろいろあって適用していない。 > >ただまあ、それでもときどきスパムが来ることもある。たとえば、本当に逆引き可能なドメインから送信されるスパムがたまにある。これはこの手法では排除できない。もうひとつ、メーリングリストなどに乗るスパムがある。 S25R にせよ Rgrey にせよ、そのホストに接続するクライアントについて考えているわけで、転送の結果、大元がおかしくてもチェックできないことがある。メーリングリストのほかに、ほかのドメインのメールから転送されてくるようなものとかもある。また、まれに greylisting をくぐり抜けてくるスパムもあるようだ。 > >今のところ私の場合は許容範囲内ではあるけれど、しばらくしたら、やっぱりベイジアンフィルタもかけるようにするかもしれない。 >

ト全

Posted by 向井 淳 on Friday, 28 July, 2006
> >http://denchu.ktplan.net/diary/diary-2006-07-3.html#2006_07_22 >を見ていて、まあいろいろ思うことがあったりなかったりしたわけですが、たいへん驚いたのが「氏家ト全」。いやーてっきり「ぼくぜん」だと思ってましたよ。そうか、そうだったのか。てことはカタカナで書くのが正式なペンネームなのか。 > >調べてみたいと思って「卜全」で検索しても「ト全」で検索してみたが、どっちもそれなりにヒットする上に、フォントから見分けづらいことこの上ないので、どっちの表記が正しいのかがよくわからない(本エントリの読者も、私がどっちを先に書いたのかわからず混乱しているかもしれない)。 > >それで、どうしても気になったので講談社のページに行って見たところ、どうやらカタカナのトを使うのが正式なペンネームであるようだった。戦国武将の方のページで、カタカナを使っているページもいくつかあって、紛らわしいと思わないでもないが、それ以前にその間違いはちょっと恥ずかしいぞ。 >

azik をやめる

Posted by 向井 淳 on Wednesday, 26 July, 2006
>scim-skk でしばらく azik を使っていたが、もうひとつ使いやすい気がしなかったので、利用をとりやめることにした。異なるスタイルでも動作することはわかったし。 > >azik が使いづらいと感じた理由は主に2つある。 > > >子音の連打で拗音が出せない > > > >単独の n が「ん」にならない > > > > >つまり、既存のローマ字の打鍵法ではうまく行かないケースが気になるということ。こういう運指は指が覚えているので、いちいち考えたり、ひらがなからローマ字に置き換えて打鍵したりしないでしょう普通。うっかりミスが物凄く多くなってしまった。慣れるまではかなりの時間がかかりそうだ。 > >逆に azik らしい打鍵数の少なくて済む方式は、慣れれば慣れる気はする。しかし、打鍵数が少なすぎて、どうもリズムが掴めず、あんまり高速化されなかった。しかし、これは慣れれば便利そうではあったが。 > >ごく一部だけ採用するという「俺仕様」を作ってみようかな。たとえば「kk」→「きん」はないが、「kz」→「かん」はある、みたいな。だめですか。そうですか。 > >「kt」→「こと」みたいな、子音の連なりから利用される局面の多いひらがなを出す、という方式にはちょっと可能性を感じた。子音だけからひらがな候補を出し、さらにそこから変換し……というのを妄想したのだが、選択肢が膨大になりそうだったのでこれはあまり上手くないようだ。しかし、まてよ、あるいは文脈に依存して、ごく簡単な確率モデルを整備してやれば(事前の数文字からの確率分布を作る)、けっこううまく行っちゃったりしないだろうか。 >

立方体切断問題

Posted by 向井 淳 on Tuesday, 25 July, 2006
>結城さんの >コレ >
に答えてみる。
> >まず、断面が正六角形になる切り方は >この図 >の方法しかない(たぶん)。すると4通りしかないことがわかる。なぜなら、2つの切断面を構成する辺が共有されることがないからだ。各面につき、この切断面を構成する辺は4つしかないので、4×6=24本の辺がある。共有されないため、24÷6=4で、4つの正六角形に相当するとわかる。 > >さて、すべて切断するとどうなるか。まず直観的にわかるのは、面の中央部分。各面は「四隅」がすべて切取られる。対称性から、切取られた残りは立方体の中央に到達する錐体となると考えられる。 >この図 >みたいな感じ。これが6つある。 > >残りの、頂点近傍はどうなっているだろうか。まず、1回正六角形に切り取った残りについて、 >このような区分 >で考える。この立体に対して、残る3つの正六角形切りのうち「対面」の1つは影響を及ぼさない。「左右」の2つはこの立体を切取り、 >この図 >のような、三角錐を2つ貼りあわせたような形状が残される。これが8つ。つまり合計で14 個の「かけら」がある。 > >では体積を計算しよう。 > >簡単なのは錐体のほうだ。底面はもとの立方体の面の半分の面積だから 1/2。高さも、立方体の中央までで 1/2。したがって、 1/2 × 1/2 × 1/3 = 1/12 が1コの体積で、これが6つあるので、 1/12 × 6 = 1/2。 > >三角錐を2つ貼る方はどうだろうか。この三角錐2つのうち、図でいうと右上の方は簡単で、合同な直角二等辺三角形3つが組み合わされた三角錐だ。問題は左下の方だ。ここで、「貼りあわせ面」については、ぜんぶ √2 / 2 の辺で、正三角形だということがわかる。そして、図の下面にある線も、上から眺めてみれば √2 / 2 と同じ長さになることがわかる。そして、元の立体の斜面にかかる2辺だが、ここで切断面は正六角形だということに注目し、また対称性から、この両辺もまた √2 / 2 だということがわかる。つまり、「左下」の三角錐は、一辺が √2 / 2 の正四面体である。 > >一辺が 2 の正四面体は、計算してみたところ 2√2 / 3 である。一辺の比が √2 / 2 / 2 = √2 / 4 なのだから、体積比はこの三乗となる。すなわち √2 / 32 だ。したがって、一辺が √2 / 2 の正四面体の体積は、 2√2 / 3 × √2 / 32 = 1 / 24。で、「右上」の三角錐は、 1/2 × 1/2 × 1/2 × 1/2 × 1/3 = 1 / 48。足すと 1/24 + 1/48 = 3/48 = 1/16。この立体は各頂点に、つまりあわせて8つあるのだった。だから 1/16 × 8 = 1/2。 > >よって合計すると 1/2 + 1/2 = 1。「かけら」の体積の総和はちゃんと1になった。 > >途中で図を描くのがメンドくさくなってしまったので説明が端折られているが、たぶんあっていると思う(計算結果があってるし)。最初は、「左右」の2つを切取る体積を引いて計算したのだが、それは何だか「同じものを足して引いたら元通り」な感があって「邪道」に感じた(実際には違うが)。そこであれこれ考えていくうちに「実は正四面体」と気付いたのがなかなか楽しかった。 > >ところで、「面部」の錐体の体積の合計と、「頂点部」の物体の体積の合計がちょうど等しくなっているというのも、なかなか面白い。 >

rdoc resolv.rb in yarv

Posted by 向井 淳 on Monday, 24 July, 2006
>一昨日書いたアレだが、手元の Ubuntu Linux (gcc 4.0.3) では無事通った。 エラーについては gdb でいろいろ見てみているのだが、どうもエラーの挙動が不思議。バイナリアンへの道は遠い。 > >ああそうそう、エラーじたいは regexec.c 内で動いているので、 yarv というより鬼車の問題なのかも。んで gcc のバージョンかプラットフォーム(glibc or not?)に依存するのかも。 > >(追記)→ gcc 4.0.4 をインストールしてビルドしたらちゃんと動いた。 irb が動かないと言っていたのも動いた。 gcc の問題だったのかなあ。 > >(追記その2) というわけで send-pr してみた→ >http://www.freebsd.org/cgi/query-pr.cgi?pr=100769 >。拙速なような気もするが。 >

数学とプログラムと例題と

Posted by 向井 淳 on Monday, 24 July, 2006
> >まつもとさんが「キミならどう書く」に文句をつけていますね >。ま、まつもとさんならこう言うか。気持ちはわかる。今回のは参戦してみたけれど、前回の素数問題は「素数? なぜに素数?」と思ったしなぁ。 > >私はべつに、「でかくても汁のしたたる」ような問題である必然性はないと思っていて、みんながいろんな解き方ができるような「遊べる」問題であることの方が企画意図としては重要なんではないかと思う。 > >たがしかし、素数にせよ h 100 にせよ簡単すぎる(スケールが小さすぎる)気がする。こんなものではナイーヴに書いても解けてしまうし、それでは「キミならどう書く」以前なのではないか。せめて h 100000 くらいからスタートすればいいのにとか思うわけだ。もっとも、問題が難しすぎると参加者が激減してしまって、主催者としてはまずいのかもしれないが。 > >「数学」のような問題に文句をつけるとすれば、こうした問題の場合、いろんな数学的事実が知られていて、効率的な解き方となるアルゴリズムがだいたい知られているというのもある。つまり、だいたい似たようなコードを書いてしまいがちである。アルゴリズムが同じであればこそ「どう書く」の言語ごとの差が浮き出る、という意図なのかもしれないけれども、なんというか、ちょっと疑問は感じるなぁ。 >

scim-skk の azik 対応

Posted by 向井 淳 on Monday, 24 July, 2006
>scim-anthy からスタイルファイルまわりのコードをかってに頂いて(ビバGPL)、ちょっとやったら azik は動くようになった。設定部分がクソですが。これも scim-anthy からもらってきたい。 > >という感じなので動作確認も兼ねて azik で書いてみたり。なかなか便利な面もあるけれど、まだ考えないと打鍵できないのでかえって遅い。慣れれば速いんだろうけれど。ローマ字の打鍵て指の動きがマクロ化されているよな、とつくづく思う。 > >azik という規則は、とても面白いと思う。ローマ字打鍵から若干の改良をほどこして打ちやすくするというアイディアは、考えたこともなかった。ただ残念なのは、ルールがアドホックすぎて敷居が高い印象を与えることか。使ってみるとなるほど打ちやすさに特化している感じはするが、それとルールのアドホックさはたぶんトレードオフなのだろう。 > >ああでも、 kt = こと、とか、母音の省略系が多いのだけど、こういうのがたいへん打ちづらく、そうか母音が入ることで打鍵のリズムを作ってたんだな、ということに気付いたり。 > >アドホックにいろいろ足していたら弊害が出まくり。 sha shi shu she sho とそれに付随するルールを追加しておいたら、 sh で「すう」が成立するケースがすごく少なくなってしまった。これはまずい。 > >それから、カナ←→かなの相互モード入れ替えを、ローマ字変換の前にやっていたところ、x > >もうひとつ困ってしまった場合。 azik で「っ」で送り仮名が始まるケースだとどーするんだろう。シフト+; だと、101キーボードなので : になってしまっておかしくなるのだが、そうでないとしてもあまり上手くない。現状は、入力してもらったキーで送り仮名を作っているのだがこのアプローチがおかしくて、コミットされるひらがなから送り仮名を抽出する方法でないといけないのだろうか。むむむ……。 > >まぁ、あんまり考えナシに入れても仕方ないということなのだろうか。 >