【Sora紹介記事】AIが物理世界を理解し動画を生成！革新的な動画モデルとして登場

OpenAIが動画生成AI「Sora」を発表しました。

以下、Sora発表時のOpenAIのサイトを要約したものです。

新しいAIモデル「Sora」が、物理世界の動きを理解し、テキストからビデオを生成する能力を持つことが発表されました。

Soraは、1分間のビデオを生成することができますが、その際にはビジュアルの品質を維持し、ユーザーの指示に忠実に従います。

このモデルは、複数のキャラクターや特定の動き、背景の正確なディテールを含む複雑なシーンを生成することができます。

しかしながら、Soraにはいくつかの弱点も存在します。

物理的なシーンのシミュレーションや特定の因果関係を正確に理解することが難しい場合があります。

たとえば、人物がクッキーを食べる場面でも、その後のクッキーに噛み跡が残らないなどの問題が発生する可能性があります。

また、Soraは時系列でのイベントの正確な記述や、空間的な詳細に関する混乱も起こることがあります。

このような問題に対処するため、OpenAIではSoraの安全性を確保するためのさまざまな手段を講じています。

具体的には、不正確な情報を検出するツールの開発や、利用ポリシーに違反するテキスト入力プロンプトの拒否などです。

また、政策立案者や教育関係者、アーティストなどとの協力を通じて、この新しい技術の懸念事項やポジティブな利用例を議論し、AIの安全性を確保していく予定です。

Soraは、GPTモデルと同様にトランスフォーマー・アーキテクチャを使用しており、高い拡張性を実現しています。さらに、過去の研究成果であるDALL·EやGPTモデルからの技術を取り入れ、ユーザーのテキスト指示に忠実に従うことができるようになっています。

このように、SoraはAGIを実現するための重要なマイルストーンとして期待されています。

※ AGIは「人工一般知能（Artificial General Intelligence）」の略称です。あらゆる種類の認知タスクにおいて人間と同等またはそれ以上の能力を持つ人工知能のことを指します。

-------

ついにOpenAIから動画生成AIが発表されました。

サンプル動画も見てみましたが、パットみではAIが生成したものとは分からないぐらい精度が高いです。

アニメーション業界でもAIの波がきそうですね。

東京エンジニア