AI エージェントの評価方法

このディレクトリのすべての AI エージェントを評価する、透明で再現可能なプロセス

私たちの約束

AgentRadar のすべての評価は、実地テストと構造化基準、継続的な再評価の成果です。評価やランキングの対価は一切受け取りません。エージェントの進化に合わせて再テストします。

各エージェントは5つの加重次元で0〜10点を採点し、総合評価を算出します。

重み 20%

新規ユーザーがどれだけ早く価値を得られるか。オンボーディング、UI の明確さ、ドキュメント、初心者から上級者までの学習曲線を評価します。

重み 25%

価格に見合った内容か。機能と制限を価格と比較し、無料枠の手厚さや有料プランの公平性を評価します。

重み 25%

ツールキットの完成度。そのカテゴリーに関連する機能の広さと深さ、各機能の実際の出来を評価します。

重み 10%

問題発生時に助けを得られるか。ドキュメント、コミュニティ、問い合わせチャネル、SLA オプションを評価します。

重み 20%

信頼性。速度、出力品質、稼働率、実際のタスク間での結果の一貫性を測定します。

エージェントが発見から公開評価まで至るプロセス

リリース、ユーザー投稿、業界シグナルを監視。実地テストの前に、正当性と開発の活発さを確認します。

レビュアーがそのカテゴリーの代表的な実務タスクを少なくとも1週間実行し、長所、摩擦、エッジケースを記録します。

ルーブリックで次元ごとに採点し、公開ベンチマークとユーザーフィードバックで検証して加重総合評価を算出します。

完全な透明性でレビューを公開。四半期ごと、また大幅なアップデート・料金変更・所有権変更時に再テストします。

レビューを誠実に保つ方法

当サイトの一部リンク経由で登録されると紹介手数料を得る場合があります。これが評価、ランキング、レビューに影響することは一切ありません。手数料が高いほど評価が高くなることはありません。

レビュアーは独立してテストします。有料掲載、スポンサー評価、あらゆる形態の「払って順位上げ」は受け付けません。

誤りがあれば知りたいです。メールでご指摘ください。確認次第、迅速に訂正します。