リプレイ、ツールのペイロード、レビューのオーバーヘッドを分割すると、OpenClaw のコスト追跡がより正確になります
OpenClaw オペレーターは、エージェントの月々の費用についての漠然とした疑問を克服しています。より有益な質問は、コンテキストのロード、ツールのペイロード、再試行、ループ、人間によるレビューを分離した場合に、1 つのタスクが成功するのにどれくらいのコストがかかるかということです。通常、最大のリークはモデルのステッカー価格ではないため、この変化は重要です。それは混合平均の中に隠れているリプレイです。
間違った数値はエージェントごとのコストです
ライブ r/オープンクローのディスカッション は、エージェントが実際の作業を行った後、人はどのようにしてコストを追跡しているのかという、運用上の質問を直接行うため便利です。単一のブレンド数値はきれいに聞こえますが、通常は実行が高価に感じられる理由が隠されています。
1 つのワークフローが最初のパスで成功し、別のワークフローがコンテキストの繰り返しのリロード、2 回の再試行ループ、および手動レビュー ホップの後に成功した場合、それらの実行は同じコスト バケット内に収まるべきではありません。予算の問題は「代理店」にあるのではない。予算の問題は、どのステップが必要以上に再生または再読み取りを続けるかということです。
リプレイにより正直な原価計算が難しくなる
OpenClaw は、より適切なアカウンティングを行うのに十分な生のデータをセッション ログにすでに公開していますが、それはチームが結果ごとにグループ化し、ソースを再生する場合に限られます。実際のバケットは単純です。コンテキストのロード、ツールのペイロード、再試行とループ、人間によるレビューです。これらが可視化されると、成功したタスクあたりのコストが、エージェントあたりのコストや顧客あたりのコストよりも有用になります。
繰り返されるツール スキーマ、ID ブロック、ハーネス レベルの再試行は、単独では無害に見えることが多いため、これは重要です。同じ成功結果を得るのに 3 回の試行と、トークン数の横に表示されないレビュー ステップが必要な場合、それらは無害に見えなくなります。
オペレータが次に何を測定すべきか
すべての実行にタスク ID を与えます。実行が完了したかどうか、リプレイが必要かどうか、どのツールが呼び出されたか、再送信された静的ペイロードの量、人間が介入する必要があったかどうかを追跡します。次に、ワークフロー、プロジェクト、および日ごとにグループ化します。これにより、コストが毎月の予期せぬ事態から運用実績に変わります。
Token Robin Hood 結果の品質が正当化される前に、チームがどこで使用が拡大するかを分析できるようにすることで、その層に適合します。重要なのは、確実な節約を約束することではありません。重要なのは、ハーネスが同じランタイム税を繰り返し支払っている箇所を特定し、証拠に基づいてワークフローを最適化できるようにすることです。
次の実践的なステップ
コストの点ですでに曖昧になっている OpenClaw ワークフローを 1 つ選びます。最初のプロンプトから最終アーティファクトまでの 1 つの成功したタスクをログに記録します。請求書をコンテキストのロード、ツールのペイロード、再試行とループに分けて確認します。次に、繰り返される 1 つのペイロードまたは 1 つのリプレイ パスを次の実行から削除します。通常、これにより、他のプロバイダーの価格比較よりも早く本当のリークが表面化します。