1 か月前、私たちは、 無料の AI をベースにしたアプリケーションのおかげで月に 10 万ドル以上を稼いでいたテクノロジー起業家、ピーター レベルズのケースを取り上げました。そのようなアプリの 1 つがTherapist AIで、「24 時間利用できる初の AI ベースのメンタルヘルス コーチ」を自称する Telegram ボットです。
しかし、この記事を公開してからわずか数日後、Levels はセラピスト AI のより高度なバージョンのテスト バージョンを示しました。これは、テキストによる対話に依存する代わりに、アニメーション化された写真のようにリアルなアバターを使用してユーザーとの音声会話を確立できる機能です。 。
さあ、ビデオ会議のすぐそばに本物のセラピストがいるようなものです。 Levels 自体は、そのようなアプリケーションの使用体験のサンプルビデオを公開しています。そのビデオでは、ユーザー (彼自身) が、ガールフレンドが下したビジネス上の決定に疑問を抱いた後、彼女と最近衝突したことをどのように説明しているかを目撃しています。
…そしてセラピスト AI に、彼女が彼のビジネス上の決定をコントロールしようとしていると信じているため、彼はイライラして罠にはまっていると感じていると説明します。アプリは、ガールフレンドとオープンで正直な会話をして境界線を設定することを提案し、さらに指導が必要な場合はアプリに再度連絡するよう勧めます。
ビデオでは、このアバターが話すだけでなく、表情やジェスチャーを使って共感や理解を伝え、会話がより「人間的」なものとして認識されるようにしていることが示されています。
また、ユーザーがいつでもどこでもアプリにアクセスできることが可視化されるため、すぐに精神的なサポートが必要だが、人間のセラピストとの予約を待つことができない人にとって、このアプリは貴重なツールになります。

セラピスト AI の背後にあるものは何ですか?
X ユーザーの Dan O’Leary 氏は、その成果を次のように要約しました。
「これは、個人事業のプロトタイプとしては信じられないほどよくできており、本当に驚くべき品質です。彼の『セラピスト』としてのスキルはさておき、これが 5 年後にどのような影響を与えるか想像してみてください。すべての要素が一つにまとまりつつあります。」
この発明の作者自身は、「これを可能にするためには多くのテクノロジーが連携する必要があり、すべてが非常に迅速に機能する必要がある」と強調しました。しかし、正確にはどのようなテクノロジーについて話しているのでしょうか?
- 音声からテキストへの変換:ユーザーの音声をテキストに変換し、チャットボットに入力できます。
- LLM (Text Generating AI Model):チャットボットの背後にある「心」。ユーザーのクエリに (テキストとして) 応答できます。具体的には、彼は最近 Llama3-70B を使用しています (レベルでは、会話からデータを記憶する優れた機能が強調されています)。
- テキスト音声合成: LLM によって生成されたテキストを音声に変換できます。
- 音声からのビデオ ジェネレーター:音声が合成されると、この AI は人の写真を使用してアニメーションを作成し、「話す」ようにします。
- FaceTime:ユーザーが AI によって生成されたビデオと対話できるようにする Apple が開発したビデオ通話アプリケーション。
