AINOW編集部です。Lightricksは、FacetuneやVideoLeapなどの人気クリエイティブアプリを開発する企業として知られていますが、この度、史上最強のAI動画生成モデル「LTX Video 13-billion-parameter model(LTXV-13B)」を発表しました。このモデルは、高品質なAI動画を従来のモデルと比較して最大30倍高速に生成でき、しかも高額なエンタープライズGPUではなく、一般的なハードウェアで動作するという画期的な特徴を持っています。
この記事のサマリー
- Lightricksが発表したLTXV-13Bモデルは、AI動画生成を30倍高速化し、一般向けGPUでも動作可能
- 「マルチスケールレンダリング」という革新的技術により、メモリ使用量を大幅に削減
- オープンソース化と無料ライセンス提供により、AI動画生成技術の民主化を推進
AI動画生成の民主化:GPUメモリ問題の解決

AI動画生成における最大の課題の一つは、膨大な計算リソースの必要性でした。Runway、Pika、Lumaなどの主要企業のモデルは、通常80GB以上のVRAM(ビデオメモリ)を搭載した複数のエンタープライズGPUでクラウド上で実行されるため、ローカルデプロイは大多数のユーザーにとって非現実的でした。
Lightricksの共同創業者兼CEOであるZeev Farbman氏は、LTXV-13Bがこの制限をどのように解決するかについて説明しています:「コンシューマーGPUとエンタープライズGPUの主な違いはVRAMの量です。Nvidiaはゲーミングハードウェアに厳格なメモリ制限を設けています — 前世代の3090と4090 GPUは24GBのVRAMが上限で、最新の5090でも32GBに達します。一方、エンタープライズハードウェアはこれよりはるかに多くのメモリを提供します。」
コンシューマーGPUでの動作を実現する技術
新しいモデルは、これらのコンシューマーハードウェアの制約内で効果的に動作するように設計されています。「完全なモデルは、量子化や近似なしで、トップクラスのコンシューマーGPU — 3090、4090、5090、およびそれらのラップトップバージョンで実行できます」とFarbman氏は述べています。
マルチスケールレンダリング:30倍の高速化を実現する革新的技術

LTXV-13Bの効率性の核心となる革新は、マルチスケールレンダリングアプローチです。Farbman氏はこれを「このリリースにおける最大の技術的ブレークスルー」と表現しています。
「この技術により、モデルは詳細を段階的に生成できます」とFarbman氏は説明します。「粗いグリッドから始めて、シーンの大まかな近似、オブジェクトの動きなどを取得します。その後、シーンはタイルに分割され、各タイルは徐々により詳細な情報で埋められていきます。」
アーティストの手法に着想を得た技術
このプロセスは、アーティストが複雑なシーンに取り組む方法を模倣しています — 細部を追加する前に、まず大まかなスケッチから始めます。AIにとっての利点は、「ピーク時のVRAM使用量がタイルサイズによって制限され、最終的な解像度には依存しない」ことだとFarbman氏は述べています。
オープンソース化:AI市場の閉鎖化に対する挑戦

多くの主要なAIモデルが閉じられたAPIの背後に残る中、LightricksはLTXV-13Bを完全にオープンソース化し、Hugging FaceとGitHubの両方で利用可能にしました。この決定は、オープンソースAI開発が商業的競争から課題に直面している時期に行われました。
「1年前は、多くのものが閉じられていましたが、今は開かれつつあります。多くの優れたLLMや拡散モデルがオープンになっているのを見ています」とFarbman氏は振り返ります。「半年前と比べて、今はより楽観的です。」
オープンソース戦略の利点
オープンソース戦略は、研究と改善を加速するのにも役立ちます。「オープンソース化の主な理由は、R&Dコストを削減することです」とFarbman氏は説明します。「学術界には多くの人々がモデルを使用し、論文を書き、あなたは本当の価値があるものを理解するキュレーターになり始めています。」
著作権問題の解決:GettyとShutterstockとのパートナーシップ

AI企業がスクレイピングしたトレーニングデータの使用に対する法的な課題が増加する中、LightricksはGetty ImagesとShutterstockとパートナーシップを結び、モデルトレーニング用のライセンスコンテンツへのアクセスを確保しました。
「AIモデルのトレーニング用データの収集は、まだ法的なグレーゾーンです」とFarbman氏は認めています。「エンタープライズセグメントには、このような問題を気にする大規模な顧客がいるため、彼らにクリーンなモデルを提供できることを確認する必要があります。」
エンタープライズ市場での優位性
これらのパートナーシップにより、Lightricksは著作権問題に関するリスクを軽減したモデルを提供でき、著作権問題を懸念するエンタープライズ市場で優位性を得ることができます。
スタートアップへの無料提供:戦略的な賭け

AI業界では珍しい動きとして、Lightricksは年間売上高1,000万ドル未満の企業に対してLTXV-13Bを無料でライセンス提供しています。このアプローチは、収益化の前にモデルの価値を実証できる開発者や企業のコミュニティを構築することを目指しています。
「考え方は、学術界は自由だということです。彼らはモデルで何でもできる」とFarbman氏は述べています。「スタートアップや業界では、ウィンウィンの状況を作りたいと考えています。AI関連のものを使って遊んでいるアーティストのコミュニティから大金を稼ぐことはできないと思います。」
成功した企業とのライセンス契約
モデルで成功した大企業に対しては、Lightricksはゲームエンジンが成功した開発者に課金するのと同様の方法でライセンス契約を交渉する予定です。「売上が1,000万ドルに達したら、ライセンスについて話し合いに来ます」とFarbman氏は説明します。
アニメーションと制作におけるAI動画の即時的な影響

LTXV-13Bがもたらす進歩にもかかわらず、Farbman氏はAI動画生成にはまだ限界があることを認めています。「正直に言って、トップモデルを見ると、まだハリウッド映画からは遠いです。まだそこには到達していません」と彼は述べています。
しかし、彼はアニメーションなどの分野で即時的な実用的な応用を見ています。クリエイティブな専門家は、AIを使用して制作の時間のかかる側面を処理できます。「高品質なアニメーションの制作コストを考えると、実際のクリエイティブな作業、キーフレームやストーリーを考える人々の作業は、予算の小さな割合です。しかし、キーフレーム作成は大きなリソースを必要とする作業です」とFarbman氏は指摘します。
将来の展望:マルチモーダルビデオモデル
今後を見据えて、Farbman氏は次のフロンティアは異なるメディアタイプを共有潜在空間に統合するマルチモーダルビデオモデルになると予測しています。「音楽、オーディオ、ビデオなどが統合されます。そして、良いリップシンクなども簡単になります。これらの問題はすべて消えていくでしょう。あなたはこれらの異なるモダリティ全体で動作する方法を知っているマルチモーダルモデルを持つことになります。」
LTXV-13Bは現在オープンソースリリースとして利用可能で、Lightricksのクリエイティブアプリ、特にそのフラッグシップストーリーテリングプラットフォームであるLTX Studioに統合されています。