ビッグデータ分析のDatabricksがシリーズEで2億5,000万ドル(約274億円)を調達 評価額は27億5,000万ドル(約3,017億円)に

2020-02-12

Jason D. Rowley, February 5, 2019

Databricksは今日、Andreessen Horowitzがリードし、シリーズEで2億5,000万ドル(約274億円)を調達したことを発表した。既存の投資家であるNew Enterprise Associates、Battery Ventures、Green Bay Venturesが今回のランドに参加した。ヘッジファンドのCoatue ManagementとMicrosoftの2社が投資家として新たに参加した。

この取引で、オープンソースソフトウェアに対するVCの関心が引き続き高まっていることを示している。ほんの数週間前、Apache KafkaプロバイダーのConfluentが、Sequoia Capitalから1億2500万ドル(約137億円)を調達し、ポストマネーバリュエーションで25億ドル(約2,745億円)を超える評価額となった。

同社の広報担当者によると、Databricksの現在の評価額は27億5,000万ドル(約3,017億円)だという。この評価は、2018年1月中旬当時、ウォールストリートジャーナルが報じた、同社が行ったデラウェア州への規制当局への申請書類を通じて開示された目標と一致している。

今回のラウンドは、これまでに調達されたDatabricksの累計調達額を事実上2倍にする。本ラウンド以前に、同社は2億4850万ドル(約273億円)を調達していると述べた。

同社は事業に関連する具体的な数値を開示していないが、Crunchbase Newsに共有されたコメントによると、同社は2018年の年間経常収益が1億ドル(約110億円)に達し、「2018年の第4四半期にサブスクリプション収益が前年比で約3倍に増加した」とされている。同社が今日時点で1億ドル(約110億円)以上のARRを生み出していると仮定すると、同社の株は15から25倍の利益で評価されている。

同社によると、世界中の2,000を超える組織が、データ分析、データサイエンス、機械学習の作業の中でDatabricksのソフトウェアを使用している。 「この信じられないほどの成長の原動力は、市場に統合分析に対する大きな要望があるからです。」と共同創業者兼CEOのAli Ghodsi氏はコメントしている。 「組織はAIに関する取り組みを成功に収める必要があります。そのためには、ビッグデータと機械学習の間にある断絶を埋める統合分析プラットフォームが必要です。」

統合分析プラットフォームのGhodsiは、10年前に共同構築を支援したテクノロジーの上に構築されていると言及している。現在、Apache Software Foundationの支援の下でオープンソースプロジェクトとして開発されたSpark(正式にはApache Spark)は、カリフォルニア大学バークレー校の現在は閉鎖されているAMPLab(「Algorithms Machines People」の略)から開発された。 Sparkの説明と命名に関する元の論文は2010年に発行されている。

Crunchbase Newsは、現在シカゴ大学のコンピューターサイエンス部門の議長を務めているMichael Franklin氏から、Sparkについてもう少し詳しい話を聞いた。Franklin氏は、AMPLabを共同で設立し、バークレーでLabのディレクターを務めてからUniversity of Chicagoに移った。彼は、Databricksを含むいくつかのビッグデータ企業のテクニカルアドバイザリーボードを努めている。

「Sparkは、スケーラブルなデータ分析と機械学習を実行するためのプラットフォームです。非常に柔軟性があり、非常に高速であることが知られています。その顕著な特徴の1つが、データを操作するためのさまざまなインターフェイスを提供していることです。」と彼は言う。 AMPLabの研究者が代表する多様な分野のために、フレームワークの範囲が拡大し、SQLスタイルの分析クエリを実行し、ストリームからデータを取り込み、(ソーシャルネットワークのような)グラフデータを操作し、機械学習モデルを訓練する方法を含むようになった。

「しかし、Sparkが成長した理由は、それがHadoopをより早くしたプロダクトだったからです。」とフランクリン氏は言う。 HadoopはMapReduceの最初のオープンソース実装で、本来Google内部で開発された分散並列化データ処理モデルだ(余談だが、Hadoopの開発はApache Software Foundationによっても促進されている。Hadoopをサポートする非営利企業Hortonworksは、2018年10月に株式公開した。)。SparkはすでにHadoopファイルシステム(HDFS)にロードされたデータを処理することが出来、フレームワークによって引き起こされるパフォーマンスの改善を実証するのに役立ち、多くのユーザーがSparkに切り替えるのを促進した。

Sparkのパフォーマンスはビッグデータと分析のグループの中で支持される要因だったかもしれないが、エコシステムと相互運用性が、現在Sparkが幅広く採用される要因かもしれない。 オープンソースソフトウェアとして、インターネット接続と最低限仕様を満たすシステムがあれで、誰でもApache Sparkを自由にダウンロードし自分のマシンで実行することが出来る。

ただし、より包括的なサービスを必要とするエンタープライズ企業のクライアント向けに、Databricksは独自のランタイム(前述の統合分析プラットフォーム)を開発した。
これは、オープンソースパッケージよりも、さらに効率的で多くの機能を提供している。 (ウェブサイトでは、Databricksと機能とApache Sparkの機能とを比較している。)Databricksは、Amazon Web Services(AWS)およびMicrosoftのAzureクラウドコンピューティングプラットフォームとのパートナーシップを通じてさまざまなレベルのサービスを提供している。

Databricksの広報担当者はCrunchbase Newsに対して、同社はApacheのオープンソース開発モデルの維持に「完全にコミットしています。」と語った。

出典:crunchbase news