AI Browser hype

OpenAI がブラウザを出すらしいという話が盛り上がっているが、実際のところどうなんだろう? みんなブラウザにそんなAI機能欲しい? ここ2週間くらい Dia というブラウザを使っているが、けっきょくAI機能はほとんど触ってない。 このブラウザでは、今見てるページについていろいろ質問できたり、テキストボックスに(そのコンテキストに合わせた)文章生成できたり、new tab page がチャットUIと統合されていて検索する代わりにいろいろ質問・チャットできる。最後のやつでは色んなWebページを閲覧して “deep research” っぽいこともできたりするし、今開いているタブを参照していろいろできたりする。 けど、普段のウェブブラウジングでそんなことあんまりやらないんだよな。私用のMacで用途が限定されているというのはあるが、見てるページを要約して欲しいことってそんなにあるのだろうか。全くないとは思わないけど、たまにだったら別タブで好みのLLMのページを開いてコピペしても大した手間でもないような気がしてしまう。テキスト生成も同様で、インストール初日に生成してもらったことがあるがその後一度も使っていない。 検索で色んなページを見られるのは使い出がありそうに思えるんだけど、でもまぁ各社のLLMで “deep research” 機能を使うのと比べて何が違うのかというと……違いはあるといえばあるだろうがそんな大きな差がある気がしないのだよね。 Arc Max ところでそういえば Dia の前身である Arc ブラウザには Arc Max というブランディングのAI機能が搭載されていた。Arc MaxはLLMの機能を使ってブラウザのよくある機能をほどよくアシストする機能で自分はなかなかよかったと思っていた。具体的には、 ブックマーク時にページタイトルを内容に即して書き換える機能 ページ内検索と統合され、曖昧に検索したりページ内の内容に質問できる機能 リンクをマウスカーソルでホバーするとリンク先のページを閲覧して要約し、要約をポップアップで表示してくれる機能 最後のやつとか、 Hacker News みたいなリンクがいろいろある中でいちいちクリックしなくてもどんな内容か(人々の反応がどんなであるか)を教えてくれて結構便利に使っていた。 Diaにはこういう機能が全然ないんだよな(タブの中身に基づいて質問したりする機能はあるけど)。なんだか残念。チャットUIを前面に出してくるのはわかりやすいが、こういうふうにさりげなくアシストする機能としてAIを使う方が未来があるしブラウザにAIを統合するという意味では正しい進化だと思うのだけど。 Dia skills そういえば上で言及してなかった機能として Dia には「スキル」という機能があった。なんらかの固定プロンプトを盛り込むことで特定のよくある作業を自動化するもので、かつLLMがいるので自動化といっても自然言語でやることを書けばいい、みたいなものだ。例えば「The VergeとEngadgetとTechCrunchを見て今日のトップニュースを教えてください」みたいな「スキル」を自分で設定して、それを呼び出せばいい。 これ全然使ってなかったのを思い出したので、まさにこのテックニュースのスキルを作ってみたのだけど……うーん、まあ悪くはない。がしかしブラウザに盛り込んであって嬉しいものなのかもよくわからなくなってしまった。そういうエージェントツールがあればいいんではないか? それこそ paywall でブロックされたニュースメディアとかもブラウザなら読めるから、という話はないでもないだろうけれども、どうにもモニョモニョした気持ちになる。ブラウザを作っている会社がだしたのでブラウザになっていますという以上の何かなのかはまだよくわからない。 AIブラウザはハイプか? というわけで「AIブラウザ」っていかにも the next big thing っぽさがあるテーマなのだけど、そこまで便利なのかというのには疑問を感じてしまっている。 Google Chrome も gemini を乗っけてくることになっているが、これも宣伝されている感じだと Dia と同程度かややしょぼいぐらいの統合度であり、そこまでよく使うものにはならなさそうという気がしてしまうのだ。 と、今のところは思っているのだけど、それを覆すような上手い機能を OpenAI が盛り込んでくれてこの流れを乗っ取ってくれるんじゃないか、というのを期待している。

July 10, 2025

Publish to Fediverse

新規記事を公開したら Bluesky と Fediverse (自分で立ててるpleromaサーバ)の両方に投稿をするように設定しようとしていて、 Bluesky の方は既存の github actions でうまくいったことが確認できたが、 Fediverse の方がどうも動いていない。 アクション自体は成功していて internal server error というレスポンスになっているのが謎。サーバ側にもログが来ていない。サーバが狂っていた可能性もあるけど面倒だし、このアクション自体は5年前に書かれて以降ほぼ何もされていないようだし……と思ったので自分で作ることにしたというか coding AI に作ってもらうことにした。 gemini-CLI に依頼したところ、サクッと curl 経由でポストするというアクションを実行を作ってくれた。 curl のフラグの挙動がよくわからなくて微調整をしたけど、多分動いていると思うのでひとまず完了: https://github.com/jmuk/fediverse-post さて動くでしょうか。乞うご期待。 https://ap.jmuk.org/notice/AvyxwkmQ113UdKPfaC 動いた! よかったよかった。

July 9, 2025

Publish Bluesky / fediverse 2

前回の記事はgithub workflowが狂ってて動作していなかったみたいなので、もう一度記事を投稿してみるテスト。こういう言い回し懐かしいな。 (追記)Blueskyは成功したっぽい https://bsky.app/profile/jmuk.org/post/3ltgqbig3ob2h 一方、Fediverseはうまくいってない。が理由がよくわからない。 “Internal Server Error” とだけ表示が出てアクション自体はなぜか成功している。

July 7, 2025

Publish Bluesky and fediverse

記事を公開するたびに、BlueskyとFediverseに記事を投稿する仕組みをgithub actionsとして入れてみた。その動作確認のための記事公開。

July 7, 2025

Wordpressのアーカイブ

移行するので Wordpress.com でホストしている旧ブログをアーカイブすることにした。 https://www.jmuk.org/wp.jmuk.org/ 以下に保存している。うまく保存されてるのかはよくわからないけど。 さて、アーカイブをどうやるかだけど、せっかくなので(当時Sonnet 3.5だった)Claude Codeにお願いしてみた。張り切って Python スクリプトをガンガン書いていく。方式としてはWordPressのAPIに沿ってコンテンツをJSONでダウンロードしてからHTMLを生成していくようだ。え、何だそれ? いやいやそんなことしたらテーマとかわからなくなっちゃうじゃん、みたいなことを言うとなるほどそうですねといってHTMLの生成を工夫し始めてきた。月ごとインデックスとかどうするつもりなのかわからんけどこれはダメだなーという印象。 それでしばらく放置していたがこないだ重い腰を上げて再開するにあたり、まっさらなレポジトリでgemini-CLIに聞いてみた。するといきなり wget コマンドでやりましょう、実行していい? みたいなことを聞いてきて考え方が違うなと感じた。wgetだと微妙な面もあるんじゃないかという気がするが、面倒だったので(フラグはdepthの設定などをちょっといじって)実行させた。取りこぼしがあるのかもしれないけど、もう面倒なのでこれでいいということにした。 アーカイブとして保存するにあたりちょっとトリッキーだったのは、画像などでクエリパラメータ付きのデータがそのままファイルとして保存されてしまうところ。ファイル名から適切な拡張子が選ばれず、Content-Typeを推定できない可能性がある部分が残ってしまう。ただそうなるパターンは数が少なそうだったので適当なヒューリスティクスで誤魔化した。それで旧サイトからリダイレクションを設定してアーカイブ完了、ということに。 それにしても、割と最近になって移行したと思ってたのだけど、なんと10年以上くらいこのサイトでブログやってたらしい。アーカイブされた記事をいろいろ眺めたりしていて昔の記事や画像を眺めるとこの10年という変遷が思い出されてなんとも趣深い。まぁ自分にとってだけの話なのですが。

June 30, 2025

My First Post

ブログを Hugo に移行してみることにした。 Static Site Generatorベースのブログシステムって実は使ったことがない。 Hugo、だいぶ歴史のあるプロジェクトという認識だけど、Static blog Generatorとしてはいまだに現役なのだな。というか Jekyll も全然現役なのだね。 せっかくなので新しくてカッコ良さそうな他の何かにしてもいいかなとちょっとだけ調べてみたのだけど、例えば Astro は自分向きではないなと思った。良い点はあると思うけど、ブログとしての作りがシンプルすぎる気がする。そんなに長く、たくさんの記事をホストするためのものという感じがない。チュートリアルを読んでみると、無のウェブサイトからページを色々作っていって、それから自分でJSでロジックを書いてページ一覧を作ったりしているのだけど、いやそういうの再発明したくないから。別に。できのいいやつを使わせてくれよ、って思ってしまった。それでチュートリアルではカバーされていないけどブログテンプレートというのもあったのでそれも試してみたところ、そういう諸々が全部テンプレートに入ってはいる。でも例えばトップページには全部のポストが並んでしまうようだった。ページネーションとかしないの? そういうところがキモなのでは?? と思うのだけどね……。タグとかはあまり使わない予定だし、どうも自分の用途には向いてなさそうだなと思った。 他のもちょっとだけ軽くチュートリアルを見てみたりしたが、やっぱり自分向きではない気がした。なのでとりあえず今はこれで行こうと思う。Markdownでエディタで書くのはどちらかというと自分はかったるいと思う派なのだが、やろうと思えば github をWebブラウザで開いて編集とかできるので、一旦仕組みを作ってしまえばあとはそれほど負担ではなさそうという気がする。 ところで、Static Site Generator を使うということは色々諦めるということではある。例えばコメント機能をつけるのは難しい。まぁ昨今のブログでコメントとか滅多にあるものではないから必須ではないといえばないのだけど、あるとちょっとだけ嬉しいとは思っている。どうしたものだろう。一つには Disqus みたいなサービスを利用するというのはあるが、 Disqus ってまだあったんですね……というぐらいの盛り下がりぶりではなかろうか。もう一つはソーシャルなサービス(例えばBluesky)のポストを監視してコメント扱いして出すようなプラグインを作るのはどうか、などと一瞬だけ思ったけど、結構スパムし放題になってしまいそうでそういうのの対策は面倒くさい。などと考えるに、自分で検索して閲覧するぐらいで十分なのではという気がしてきた。 Bluesky ならカスタムフィードを作っておけば閲覧は容易であるし。まぁそもそもそんなに反応とかあるかというと、別にないわけですけど。 もう一つ ActivityPub サポートがない。今はすごく必須という気はしないけど個人的にはあると嬉しい。だがそのためになんらかのブログエンジンを使いたいかというと……そんなことはないよな。 て考えてみると、結局のところ新しい投稿があったらそのことを自分の ActivityPubのフィードにAPI経由で投稿するというアクションを作ってやればそれでいいのではないか、という気がしている。そういうのを作るのは結構かったるいのではないかと思っていたが、既存のアクションもあるし、そういうのを組み合わせるのはcodingagentの得意とするところで、サクッと作れてしまった。さてどうなりますか。

June 21, 2025