そういえばここ最近、趣味プログラミングの一環としてコーディングAIエージェントを作っていた。もちろんLLMの部分は既存のものをAPIで呼び出すだけだけど。
https://github.com/jmuk/sylvan
とりあえずGo言語で書いている。というのは他にGoで書いてるものが(いっぱいあるんだろうけど自分は)知らなかったので。でもこういうツールってシングルバイナリで配布できたほうがいいんじゃない?とか思っている。いや配布してないですけど。
さて、コーディングAIエージェントを作ってみて、まだまだ未完成だが「割と動く」ところまではかなりすぐできた。作り始めてから1週間ぐらいで初歩的なツールは大体作り終えて Hello, world プログラムを書いてもらってファイルに保存して実行して動作確認するみたいなところまではできている。これは自分がすごいということではなくて、最近のLLMってめちゃくちゃ賢いので、雑に作っても割と動いてくれるからである。初歩的なファイル操作ツールを実装して接続すれば結構動いてくれる。
もちろん「割と動く」レベルから使えるツールレベルに至るには膨大な労力が必要だということもわかっていて、個人で趣味でやっていても既存の他のツールと「戦える」ようなクオリティに到達するのはなかなか難しいだろうなということもわかってきた。例えば今は入力で使っているライブラリの関係で複数行入力ができない(enterを押した瞬間に入力が完了してしまい処理が始まってしまう)のだけど、複数行入力とか長文のプロンプトをコピペみたいなことができなくて不便。まあ趣味なので細々とやって行けたらいいかなぁとは思うけど。飽きるまでは。
ちなみに先日書いたように Advent of Code 2025 を自力で解き終わったので、AIにも解かせてみてどれぐらいできるのか確認してみようかな、と思い立ち、ちょっと解かせてみたところ割と解けた。でも初日でも結構色々苦戦していた。まあ今年の初日はちょっとコーナーケースとかハマりがちではあるのだけど、流石に苦戦しすぎではという気がした。でも9日目も11日目も割と苦戦の末に解けていたので偉い。自分で解くよりだいぶ速い。コードははちゃめちゃだけど。
MCPも実装しているので、Chrome MCPとかと繋いで、適当なログインアカウントも設定できれば、自力でページを見て問題をダウンロードして解答をサブミットするみたいなことまでできるだろうなとは思う。でも第三者のサービスでそういうことをするのは気が引けるので全てローカルで解いてみて自分の回答と一致しているかどうかで判定しています。