top of page
検索
執筆者の写真T. Abe

Rabbit の Web ベースの「大規模アクション モデル」エージェントが 10 月 1 日に r1 に登場

この記事は、以下のリンクから元記事をご覧いただけます。


2024年初頭に大きな期待を集めたRabbit r1だったが、その野心的な計画が実現しなかったため、期待はすぐに薄れてしまった。CEOのジェシー・リュウも「最初から期待を高くしすぎた」と認めつつ、来週予定されているアップデートにより、待望のLarge Action Model(LAM)がついにウェブ上で展開されると述べている。だが、これが遅すぎるか、あるいは目標の変更だとみなす声もある。しかし、ウェブやモバイルアプリを超えて、プラットフォームに依存しない汎用エージェントを構築するというRabbitの目標には、依然として理論的な価値が残されている。


TechCrunchとのインタビューでリュウは、過去6ヶ月間は主に出荷、バグ修正、応答時間の改善、そしていくつかのマイナーな機能追加に忙殺されていたと語る。これまでにr1には16回の無線アップデートが適用されたが、その機能は主に特定のLLM(大規模言語モデル)とのやり取りや、UberやSpotifyなど7つの特定サービスへのアクセスに限定されている。リュウは、「それはLAMの初期バージョンであり、データ作業者から収集した記録に基づいてトレーニングされましたが、汎用的なものではなく、これらのサービスに接続するだけでした」と述べた。


### 汎用的なWebエージェント

しかし、リュウは汎用バージョンのLAM、つまり特定のアプリやインターフェースに依存しないバージョンのリリース準備が整ったと説明する。この新しいWebベースのエージェントは、コンサートチケットの購入、ウェブサイトの登録、オンラインゲームのプレイなど、様々なタスクを遂行する能力を持っている。


リュウによれば、「9月末には、r1は突然、より多くのことができるようになる。どのウェブサイトでも実行できることをサポートする」とのことだ。デモでは、新しいウェブサイトでの映画祭登録を実演してみせた。数秒ごとにアクションを実行し、Googleでドメインレジストリを検索し、最適なドメインを選択し、14ドルで「filmfestival2023.com」を購入した。


### エージェントの学習と課題

このWebベースのエージェントは、特定のブラウザに依存せず、クラウド内で動作する新しいクリーンなブラウザを使用している。ユーザーの資格情報は直接アクセスされず、将来的には安全な方法でログインを支援する小さな言語モデルを使用する可能性がある。


デモからは、これは単なる理論ではなく、実際に動作する汎用Webエージェントであることが示された。ただし、まだ完璧ではない部分もあり、リクエストの言い回しによっては成功率が異なる。リュウも、まだ多くの改善が必要であり、最終版ではないことを認めている。「モデルは計画を立てるには十分賢いが、手順を飛ばすほど賢くはない」と語るように、モデルのさらなる成長が期待される。


### まだ解決すべき課題

興味深いことに、同社はデスクトップエージェントの開発にも取り組んでおり、将来的にはワードプロセッサや音楽プレーヤーなどのアプリとも連携可能な汎用エージェントを目指している。だが、「キラーアプリ」はまだ存在せず、このエージェントが日常的にどれほど役に立つかは未知数だ。


### ビジネスモデルの挑戦

Rabbitのビジネスモデルに対する一般的な批判として、「これはアプリとして提供されるべきではないか?」という声もあるが、リュウはこれに対し、「計算すると意味が分からない」と反論している。初日からAppleやGoogleを敵に回すことは避けるべきだとし、サードパーティのAIやデバイスがユーザーの代わりに他のサービスを操作できる「クロスプラットフォームの汎用エージェントシステム」を構築することが目標だと語った。


Rabbitは、今年初めに約束した機能を実現するため、OTAアップデートを通じてすべてのr1所有者に新しいモデルを提供する予定だ。

閲覧数:0回0件のコメント

Comments


bottom of page