AIが創るソフトウェア開発の新時代――Magicの大規模投資から見る「超長文コンテキスト」の可能性

開発

生成AIや大規模言語モデル(LLM)がコード生成やソフトウェア開発の現場に本格的に入り込みつつあります。そんな中、AIスタートアップの「Magic」が大きな注目を集めています。

2024年8月29日に3億2千万ドル(約320億円)の大型投資を獲得し、共同創業者には元Google CEOのエリック・シュミット氏やAlphabet傘下のCapitalG、さらにはAtlassianや有名投資家らが名を連ねるなど、かなり豪華な顔ぶれが集まりました。本記事では、そんなMagicの取り組みや、彼らが強みとしている「超長文コンテキストを扱うモデル」のインパクト、そして同社が目指すソフトウェア開発自動化の可能性について詳しく掘り下げていきます。

投資の背景とMagic社の概要

Magic
Magic is an AI company that is working toward building safe AGI to accelerate humanity’s progress on the world’s most im...

8月29日にTechCrunchなど複数のメディアで報じられた内容によると、Magicは今回のラウンドで3億2千万ドルもの巨額な資金を調達しました。

出資者には、かつてGoogleを率いたエリック・シュミット氏や、Alphabet傘下のCapitalG、Atlassianなどが含まれており、スタートアップとしては異例の大規模調達です。これにより、Magicの累計調達額は約4億6,500万ドルにのぼり、企業価値が5億ドルから急上昇したと見られています。

Magicは2022年に創業され、共同創業者の一人であるエリック・スタインバーガー氏は高校時代からAIに触れ、大学時代(ケンブリッジ大学でコンピュータサイエンス専攻)を中退してメタ社(旧Facebook)のAI研究者として活躍。その後、CTOのセバスチャン・デ・ロ(Sebastian De Ro)とタッグを組んでAI開発を始めました。二人は気候変動対策のボランティア団体で出会ったというユニークな経歴を持っています。

このような多彩なバックグラウンドをもつ創業メンバーが率いるMagicは、コード生成を中心としたAI支援ツールを作っています。彼らの理念は、単なる自動コード補完にとどまらず、大規模なコードベース全体を理解し、自律的に問題を解決するようなエージェントを目指している点が特徴的です。


Magicの「超長文コンテキスト」アプローチ

従来のLLMが抱える課題

一般的な大規模言語モデルは、入力として与えられたテキストを「コンテキスト」として取り込みます。しかし、このコンテキストの大きさには制限があり、従来は数千~十数万トークンが限度でした。

たとえばOpenAIのGPT-4oは最大128kトークン、AnthropicのClaude 3.5 Sonnetは最大200kトークン、そしてGoogleのGemini 1.5 Proが2M(200万)トークンという驚異的な長さを扱うと発表しています。

しかし企業規模のソフトウェア開発では、数百万~数千万行のコードや大規模ドキュメントを扱うケースも珍しくありません。「コード理解」の観点から見れば、既存LLMのコンテキストでは不十分と言わざるを得ない場面が多々あるのです。

MagicのLTM-2-miniモデルとは

Magicが力を入れているのは「LTM(Long-term Memory)」と呼ばれる独自アーキテクチャで、超大規模なコンテキストウィンドウを可能にする点が特徴です。最近公表されたモデル「LTM-2-mini」では、なんと1億トークンもの文脈を扱えると謳われています。

この1億トークンはざっくり1千万行のコード、もしくは750冊分の小説に相当する規模です。
多くのLLMが数百万トークンでも限界に近い中で、Magicはそれを大きく上回る超長文への対応を目指しており、コードリポジトリ全体を読み込んでバグ修正やリファクタリングを自動で行う可能性を示しています。

「長文対応」による新たなユースケース

  • 数十万行以上のコード精査: 巨大リポジトリを全自動で解析し、脆弱性検知やリファクタリングのポイントを提案する。
  • 長大なドキュメント理解: 企業が蓄積した設計資料やユーザーマニュアルを一度に読み込み、質問に答えたり要約を生成したりする。
  • 反復的なプロジェクト管理: 過去のすべてのコミット履歴やチケット情報を学習し、開発チームのタスク計画を高度に最適化する。

これらは従来のLLMでは難しかった領域ですが、Magicの超長文対応アプローチにより実現が期待されています。

資金調達のインパクト

Magicの累計調達額は今回のラウンドを含め、4.65億ドル(約465億円)となりました。比較として、類似分野のCodeiumやCognitionなども多額の投資を受けていますが、Magicの3.2億ドルのラウンドは一際目を引きます。

これほどの巨額投資が集まる背景には、生成AI×コーディング支援の市場規模が今後急拡大すると見込まれている点があります。ある推計では、こうした「AI開発支援ツール」の市場が2032年までに270億ドルを超えるとされており、投資家にとっても大きなリターンが期待できる領域なのです。

ただし、生成AIが生むセキュリティや著作権の懸念は根強く、企業が導入を躊躇するケースもあります。コーディング支援ツールがソフトウェアライセンス違反を助長してしまうリスクや、誤ったコード生成によるバグの増加、機密情報の流出などが課題です。

それでも、GitHub Copilotなどの普及状況を見ればわかるように、多くの開発者がAIの導入に強い関心を示しています。MicrosoftはCopilotが「約50,000社のビジネスユーザー」を獲得したと公表しており、Magicのようなスタートアップにも大きな成長余地があると考えられています。

Magicの今後の展望と競争力

スーパコンピュータ構築計画

MagicはGoogle Cloudと提携し、2つの大規模クラスタ(Magic-G4とMagic-G5)を構築すると発表しています。
G4はNvidia H100 GPUをベースにし、G5は来年登場予定のNvidia Blackwell GPUを採用。これらのクラスタを「数万GPU」のオーダーで拡張し、160エクサFLOPSの演算能力に到達するとしています。
160エクサFLOPSとは、1秒間に10^20回の演算処理が可能ということ。人間の脳神経のシナプスに挑むかのようなレベルの計算力を目指している点がMagicの壮大なビジョンを物語ります。

AGI(汎用人工知能)への野心

Magicの公式サイトを見ると、単に「コード生成を高速化する」のみにとどまらず、最終的にはAGI(人間以上に汎用的に問題を解決できるAI)を目指している旨の記述があることがわかります。共同創業者のスタインバーガー氏は、「コード生成はAGIの入口」と捉えている様子。
もちろん「AGI」という言葉はバズワード化している側面もあり、実際にどこまで実現できるかは未知数です。それでも、超長文コンテキストに基づく膨大なコード解析や自律的な修正提案ができれば、従来のAIを超えたレベルの知的支援が可能になるかもしれません。


他社との比較と市場の展望

CodeiumやCognition、Poolsideなど、AIコーディング支援スタートアップは乱立状態といえます。さらに大手ではMicrosoft(GitHub Copilot)、Google(Codeyなど)やMetaも独自モデルを出しており、競争は激化しつつあります。
しかし、Magicが目指す「1億トークン以上の超長文コンテキスト」というアプローチは差別化ポイントとして非常に大きいでしょう。多くのモデルは数十万~数百万トークンあたりで限界を感じており、それを大幅に上回るモデルを設計・実装するのは簡単ではありません。
この技術が本当に安定稼働し、コスト面やバグ面もクリアできれば、大規模エンタープライズのコードベースや膨大なドキュメントを一元的に扱う特化モデルとして大量導入が見込まれる可能性があります。


実用化への課題と期待

  • 計算コスト: 超長文コンテキストはメモリ使用量・GPU計算量が膨大になるため、推論にかかるコストが非常に高くなるリスクがある。MagicはNvidia Blackwellなど次世代GPUの利用でスケールを図るが、実際に費用対効果がどの程度成立するかは注視が必要。
  • 品質管理: 長文を扱えば扱うほど、モデルが途中で「文脈を誤解」する可能性が増える。誤ったコード提案や不要な修正リクエストを生成しないよう、品質面での評価・フィルタリング方法が鍵を握る。
  • セキュリティ: コード自動生成が容易になる一方、セキュリティ脆弱性を含むコードが生まれるリスクも拡大する。モデルが潜在的な脆弱性を「学習」してしまわないよう、学習データの整備とモデル監視が欠かせない。

まとめ

AIによるコーディング支援は既に当たり前になりつつありますが、Magicが打ち出す「超長文コンテキスト+巨大クラスター構築+AGIへの道筋」というビジョンは、他社を一歩リードし得る大きな要素を含んでいます。今回、3.2億ドルの大型資金調達を達成し、大手VCや著名企業の支援を取り付けた背景には、今後のソフトウェア開発を根本から変える潜在力への期待があるのは間違いありません。

他にも開発エージェントが増えてきていますが、大量のデータを処理するサービスが残っていくと考えられますね。

実用面では、GPUのコスト増や大量のトークンをどう効率的に処理するか、セキュリティ上の懸念など課題が山積しています。それでもAIコーディング支援ツールの市場規模は今後急速に拡大すると見られ、MicrosoftのCopilotやGitHubなどが既に実例を示しているように、一般の開発者からエンタープライズ企業に至るまで幅広く需要が高まるでしょう。

Magicはその中でも特に「より多くのコードやドキュメントを一気通貫で扱う」点を売りに、巨大モデルを育てていく計画です。エリック・シュミット氏やAtlassianといった実績あるプレイヤーが後押しすることで、開発体制も一段と加速することが期待されます。

もし実際に“1億トークン”レベルのコンテキストを手軽に扱えるようになれば、数千万行規模のリポジトリを丸ごと解析しながら改修方針を提案するAIエンジニアが誕生するかもしれません。これはまさに、AGIの入り口とも言えるビジョンです。

今後もMagicの取り組みからは目が離せません。超長文を理解するAIがビジネスや開発現場にもたらす恩恵と、それを取り巻くコストやセキュリティの問題――この両面を見据えながら、AIとソフトウェア開発の未来を考えていく必要があるでしょう。まさに、新時代の幕開けを感じさせる出来事と言えそうです。

サービス名対象ユーザー特徴価格商品カテゴリ商品URL
GitHub Copilot開発者コード補完AI無料/有料開発商品
Replit Agent開発者自然言語でアプリケーション開発が可能なAIエージェント無料/有料開発商品
Cline開発者コード補完AI無料/有料開発商品
Dify開発者AIワークフロー、チャットボット、LLMOps、データパイプライン開発SaaS無料/有料開発商品
Jinbaflow開発者AIワークフロー、チャットボット、LLMOps、データパイプライン開発SaaS無料/有料開発商品
Copied title and URL