最近のAIエージェント環境

こちらのブログにも時々は記事を書かないと。

ちょっとこのブログも方向性というか、記事の書き方を変えていこうかなとは思っている。このAI全盛期の時代・・・大航海時代ならぬ大AIエージェント時代、AIに書けそうな理路整然とした記事というのは面白みが無い。個人ブログらしい脱線も含んだ人間味のある記事のほうがいい。

今のAIエージェント環境
- Hermes Agentのいいところ
- Hermes Agentのイマイチなところ
AIエージェントの維持費
これからのAIエージェント環境
エンジニアとして

今のAIエージェント環境

人間味のある文章で今のAIエージェント環境を語りたい。

前の記事でHermes Agentを試した話を投稿した。

Hermes Agentを試す

この環境は今でも毎日使っていて、Hindsightも正常に動作している。DeepSeek V４Flashも最高というわけではないが、まあ実質使い放題と考えると及第点位の性能は出していると思う。

最近は環境が安定してきていじることは減ってきたけど、まあいじる必要がないということは問題がないということだろう。

Hermes Agentのいいところ

セッションが全部SQLiteに保存されていて、全文検索で自由にセッションを復元できる
- Claude Codeではjsonlだったかに保存されていたので、これをやるには別途仕組みを作ってやる必要があった
特に何も言わなくても黙ってPythonコードを書いて実行しようとしてくれる
- 何でもかんでもAIのToolでやって、無駄にトークンを消費しないようにする設計になっている。Pythonでやったほうがエコシステムも充実しているので早いことが多い
大抵の機能がセルフホストかFeatherless AIなどの定額APIにオフロードできる
- 埋め込みはFeatherless AIのQwen。検索やスクレイピングはセルフホストなど、運用上の選択肢が多い
- とりあえず完全定額制システムを作ることができる
Visonモデルを個別に設定できる
- DeepSeek V4 FlashはVison対応ではないが、画像認識だけVison対応モデルに依頼することがデフォルトの機能でできる。これはオープンウェイトモデルを使う上で非常に便利

全体的に、オープンウェイトモデルを使って安く回すための工夫がよく考えられている。

Hermes Agentのイマイチなところ

正直あまり無いんだが、まああえて言うならシステムとして結構な複雑性があるので、初心者が維持管理するのは結構難しいかもしれない。Claude Codeみたいに、これさえ入れておけばエコシステム完備で何も考えなくてもある程度の環境が手に入るみたいなものではないので、環境構築が面倒というのはデメリットかもしれない。もちろん、これはメリットの裏返しでもあるが。

AIエージェントの維持費

上記のように、結構この環境は良いのだが、TVショッピングなら「でも、お高いんでしょう？」と言いたくなるような環境だと思う。

実際、正直お安くはない。もっとも、これはAIエージェントにいくら課金できるかの話によるので、絶対的な評価は難しい部分でもある。

例えば、今ローカルLLM界隈でデファクトスタンダードとなっているDGX Sparkだが

こいつは普通に100万円くらいする。しかし100万する割には、先に挙げたDeepSeek V4 Flashを動かすのはきついくらいのスペックとなっている。

現時点での話だが、ローカルLLMでクラウドモデルと同等の性能を出すのは不可能と言って良い。もちろん、Qwenなどを使えばそれなりの性能は出せるが、クラウドと同等ほどではない。まあ、ローカルLLMでも十分なタスクが増えてきたのは事実ではあるが。

仮にDGX Sparkを買ったとして、車みたいに5年も10年も現役で使えるわけではない。今の時点でローカルLLMを使うのは一種の趣味か、実験的なプロジェクトに限った話であり、個人では採算が合わない。

このような状況を考えると、たとえ一ヶ月100ドルちょっとくらいかかったとして、常に最新モデルが使えるのなら、AI関連投資としてはまあ妥当ではないかと思う。

そもそも、ChatGPTやClaude、Geminiなどのサブスクが安すぎるのだ。彼らは常に赤字を垂れ流しつつ、VCの輸血であの価格を維持している。今のAIの「普通の値段」は普通ではないのだ。

これからのAIエージェント環境

最近、職場でもAIエージェントが云々という話を聞くようになってきた。おそらく今後は、すでに導入しているSaaSなどにAIエージェント機能が付与されるようになって、AIに何かやらせるというのが少しずつ当たり前の世の中になっていくのだと思う。すでにMicrosoft365のCopilotを活用している動きは時々見かけるし。

そこでまた問題になるのが、AIに食わせるデータがないという話になってくると思う。あるいはデータはあるが、食わせる形に適切に集計できていないような状態だろうか。

データはあるが適切な整形がされていない問題については、AIによってある程度改善される可能性はある。例えばエクセル管理表があって、一つのセルになにかいろいろな情報を詰め込んでいるようなものがあった場合、今まではまずその詰め込んだ内容を構造化するところから始まった。

しかしながら、AIによってその構造化が適切にできるようになれば、システム化も幾分容易になるとは思う。もちろん、その「適切な構造化」を改めて設計する必要はあるが。

AIエージェントの登場によって、コーディング自体は確かに自動化されたし、自分自身最近はほとんどコードを書いていない。プログラマーの間では、それでもコードをレビューする仕事が残るというのが定説だが、そもそも我々兼業プログラマーにはコードレビュー文化自体がないので、動いた、ヨシッ！が昔から当たり前だったのだ。

動いた、ヨシッ！が当たり前の現場で何が重要かと言うと、その処理がビジネスロジックをきちんと反映できているかという点が重要になってくる。というか、極論を言うとコード品質なんてどうでも良くて、処理が正しく終了すればそれでいいのである。

自分はプログラムの品質保証については素人なのでよく分からないが、実際のところ真面目にコードレビューをしている会社がどの程度あるのかはちょっと疑問だ。少なくとも、自分が知ってる商用ソフトの一部では、テストしてんのかってレベルのバグがあるソフトをそのまま納品してきたりする。まあ、そのバグというのもUI周りの軽微なものであって、制御システムとかそういったクリティカルな部分にバグはないのだが。

さて話が逸れたが、これからのAIが一般的な製造業の現場に普及してきても、多分エンジニアが不要になることはないと思う。ただ、巷で言われているように、ジュニアエンジニアが育ちにくい環境にはなるかもしれない。

少なくとも、ちょっと前に流行ったスクールに行って、ググってコピペでイッセンマンみたいなルートはなくなるだろう。そういった付け焼き刃では乗り切れない、エンジニアとして生きていけない時代にはなると思う。少なくとも、プログラミングというのが限られた人間のみができるという時代は終わった。

エンジニアとして

このブログでは、エンジニアとしての自分のパーソナリティを出しつつ、技術的なことにも触れていきたい。できれば、誰かの気付きになるような文章をかければと思う。

逆を言うと、このブログにはハウツー的なことはもう書かないと思う。そんなもんはAIに聞けばいい話で、自分が時間を割いてここに書く必要はないだろう。というか、もはや技術的なことをAIにやらせて、人間はそこに関与しない的な使い方さえ一般的になっているので、なおさら人力でコマンドを打ってエラーをググって解決するような時代ではなくなるのかもしれない。

ここ10年、いやここ3年くらいで一気にエンジニアとしての人間の役割が変わった気がする。こんな時代だからこそ、今から工学を学び始める青少年には、うわべだけの習得ではなく、技術の本質を理解するような学び方をしてほしい。自分で手を動かして、失敗して学んでいく楽しさを知ってほしい。

そういうわけで高専がおすすめですって話で今日は終わり。