Skip to content

Ollama Cloudを試す

By vinesystems

サブスク氷河期?

最近、Claudeのサブスクで、Claude Code以外の経路からアクセスして使う方法(claude -pでワンショット起動含む)の場合は、サブスクの適用範囲外になるという出来事があった。

これですね。自分が今まで構築してきたObsidianのシステムは、思いっきりこれに依存していたので、大幅な方針転換を迫られた。

Codexに逃げるか?

今のところ、Codexの方はClineもChatGPTサブスクでログインできたりと、割と自社のエージェント以外からの経路でもサブスクの利用範囲内としているが、これもいつまで続くかわからない。サムアルトマンも、昔から月々3万円くらいするChatGPT Proでさえ赤字だと言っているくらいなので、今後は自社のハーネス以外からのアクセス制限はますます強くなるだろう。

そもそも、今のサブスク前提の料金体系についても、今後は上限が厳しくなる可能性は十分にある。

従量課金+API前提のサブスクが勝ち筋かもしれない

今のAI業界の流れを見ていると、少なくとも各社が自社製ハーネス(CodexとかClaude Codeとか、Gemini CLIとか)以外から、サブスクの範囲内で使える経路を残し続けるとはあまり思えない状況となっている。

そうなると、どこかのベンダーに固定して課金するか、まんべんなく全部に課金するかの二択になるわけだが、前者はベンダーロックインされてしまうし、後者は使わない機能に無駄に金をかけすぎてしまう可能性がある。

そういったことを色々と検討すると、これからの時代は従量課金とAPI利用前提のサブスクを並行して使用するのが、最も賢い使い方ではないかと思う。

だが、ネット上を探しても、この使い方でAIを使っている人の例があまりなかったので、今回ブログ記事として書いてみることにした。

従量課金の問題点とその改善方法

従量課金の問題点として

  • コスト管理の難しさ
  • サービス多すぎ問題

この二点がある。実はこの二点は両方同じ原因から来るもので、つまりはサービス提供業者が多すぎるという点が問題だ。

例えば、OpenAIとAnthropicの両方のモデルを使いたいと思ったとき、普通ならOpenAIとAnthropicの両方でAPIキーを発行し、料金をチャージすることになる。2つくらいならなんとか管理できるが、これがもっと増えたときに、各社全体でどの程度金額を払っているのか把握するのが難しくなってくる。

API前提のサブスク

ChatGPTやClaude、Geminiなどのサブスクは、どれも基本的に自社サービスを普及させる目的のサブスクであって、自社サービスのシェアを広げる代わりに、API料金との差額を各社が補填するというのが今のビジネスモデルとなっている。

現状では、例えばChatGPTのサブスクリプションでClineが動くなど、サブスクを使ってその会社以外のサービスを動かすみたいなことができているが、今後はこのような経路はどんどん塞がれていくと思う。

僕みたいに、APIをメインで使いたい側の人間の場合は、こういった特定のサービスのサブスクを規制に怯えながら使うのではなく、そもそも最初からAPI利用を前提としたサブスクを使うべきだ。

従量課金の管理方法

従量課金の管理方法が煩雑という点については、各社のAPIへのアクセスを一箇所でプロキシしてくれるシステムを使用する。いろいろな種類があるが、今回はLiteLLMを使用した。

LiteLLM
LLM Gateway (OpenAI Proxy) to manage authentication, loadbalancing, and spend tracking across 100+ LLMs. All in the OpenAI format.
www.litellm.ai

API前提のサブスク

API前提のサブスクとして

このredditに色々と載っている。最近では、主に中国勢のLLMベンダーが安価なコーディングプランを出しているが、データの扱いなどが不明瞭でちょっと怪しかったり、明確にコーディングのみの利用を想定していると書いてあったりと、汎用的に使えるものはなかなか無い。

僕の用途の場合、LibreChatのチャットも含めてサブスクに乗せられるなら乗せたかったので、プライバシーが問題なさそうで、かつ用途も限定されていないOllama Cloud Proをサブスクリプションしてみることにした。

Ollama Proでできること

Cloud models · Ollama
Cloud models on Ollama.
ollama.com

Ollama Cloudでは、このページに記載されているモデルが利用できる。

これらのモデルは、先述したLiteLLMから使用することも可能なので、サブスクモデルと従量課金モデルを同じ入口から使えるようになる。これは管理面でかなり楽になることが期待される。

とりあえずOllama Cloudを使ってみた感想

早速20ドルのProプランにサブスクして、試しにOpenCodeでエージェントを動かしてみたり、LibreChatでチャット会話をしてみた。レスポンス時間は問題なく、Proプランでもちょっと試してみたくらいではそれほど使用量を圧迫しなかった。

しばらくはOllama Cloud ProとLiteLLMの従量課金で運用してみることにする。

おわりに

今回は、今後のAIシステムの構成について検討した。AIコストを抑えつつ、それなりにストレスなく使うには色々と工夫が必要だが、今後も最適なAIコストを見極めつつ、AIに使われるのではなく、AIを有効活用していきたい。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA