H2O とは?

H2O

H2O(機械学習プラットフォーム)最新情報

NRIのOpenStandiaが提供するH2O(機械学習プラットフォーム)最新情報

※WebサーバのOSSであるH2Oについては、こちらのページを参照して下さい。

OSSの保守サポートサービスの内容はこちら OSSの導入については、こちらのフォームからお問い合わせ下さい OSS全般の事例紹介はこちら

H2Oバージョンアップ情報

すべてを見る

更新日:2021-05-20

H2Oの概要

H2O.ai

H2O(エイチツーオー)は、線形スケーラビリティーで拡張可能な分散型インメモリー機械学習プラットフォームです。H2Oは、H2O.ai社によって開発され、オープンソースソフトウェアとして公開されています。勾配ブーストマシン、一般化線形モデル、ディープラーニングなど、最も広く使用されている統計および機械学習アルゴリズムをサポートしています。

業界をリードするAutoML(Automated Machine Learning:自動機械学習)機能があることもH2Oの大きな特徴の1つです。すべてのアルゴリズムとそのハイパーパラメーターで学習を自動的に実行して、最高スコアのモデルのリーダーボードを作成します。

リーダーボード

図: リーダーボード

AutoMLが可能な他のOSSとの大きな違いは、H2Oがソースコードを1行も書くことなくGUIのみですべての機械学習フローを実現できる点です。GUIを利用せず、PythonやRで実装することもできます。

H2O.ai社は他にも「Sparkling Water」というOSSを開発しており、これによりH2Oの高速でスケーラブルな機械学習アルゴリズムとSparkの機能を組み合わせることができます。

Sparkling Waterの概念図

図: Sparkling Waterの概念図

H2O.ai社は、商用製品のDriverless AIも2017年春にリリースしています。これは、企業向けの自動機械学習ができるソフトウェアで、特徴量エンジニアリング、モデル構築、視覚化、解釈を自動化します。他にも以下の商用製品もリリースしています。

  • Enterprise Steam: 包括的なIT制御による安全なセルフサービスの人工知能環境
  • Enterprise Puddle: プライベートクラウドでH2O製品を起動するための安全で便利な方法を提供する

H2Oのプラットフォームは、世界中で18,000を超える組織で使用されており、RとPythonの両方のコミュニティで非常に人気があります。

TOPに戻る

H2Oの機能および特徴

H2Oは、機械学習に関する基本的な機能を備えているだけでなく、同類のソフトウェアには存在しない(または、より優れた)機能や特徴があります。公式サイトでは「Key Features of H2O」として、以下を挙げています。

  • 主要なアルゴリズム
    ランダムフォレスト、GLM、GBM、XGBoost、GLRM、Word2Vecなど、分散コンピューティングや教師ありと教師なしの両方のアプローチのためにゼロから開発されたアルゴリズムがあります。
  • R、Python、Flowなどからのアクセス
    R、Pythonなどの既知のプログラミング言語を使用してH2Oでモデルを構築するか、H2O Flow(以下のようなコーディングを必要としないグラフィカルなノートブック・ベースのインタラクティブなユーザー・インターフェイス)を使用できます。
    R、Python、Flowなどからのアクセス
  • AutoML
    AutoMLを使用すると、機械学習のワークフローを自動化できます。これには、ユーザーが指定した時間内に多くのモデルを自動的に訓練し、チューニングする機能が含まれます。Stacked Ensembleは、異なるモデルごとに自動的に訓練され、ほとんどの場合、AutoMLリーダーボードで最もパフォーマンスの高いモデルになる予測精度の高いアンサンブルモデルを生成します。
  • 分散インメモリー処理
    大量のデータセットを扱えるように、ノードとクラスター間の高速な直列化によるインメモリー処理を行うことができます。ビッグデータの分散処理は、粒度の細かい並列処理により最大100倍の速度を実現し、計算精度を低下させることなく最適な効率を実現します。
  • 導入が簡単
    H2Oを使用すると、構築したモデルをPOJO(Plain Old Java Object)やMOJO(Model ObJect, Optimized)に変換することができます。これをJavaアプリケーション内にデプロイするだけで、指定したデータセットを実行するようにスケージューリングできます。

    起動も非常に簡単です。
    $ wget http://h2o-release.s3.amazonaws.com/h2o/rel-zahradnik/1/h2o-3.30.0.1.zip
    $ unzip h2o-3.30.0.1.zip
    $ cd h2o-3.30.0.1
    $ java -jar h2o.jar

TOPに戻る

H2Oのライセンス

H2Oのライセンスは、「Apacheライセンスバージョン2」(Apache License version2)というライセンスに基づいて公開され、営利、非営利を問わず、誰でも自由かつ無償で利用・改変・再配布できるようになっています。

H2Oのライセンスについてご不明な点がありましたら、お気軽にお問い合わせください。

TOPに戻る

H2Oと同類のソフトウェア

H2OのようなAutoMLができるOSSの機械学習のプラットフォームは他にも多数あります。既存の機械学習ライブラリーを利用しコードを削減するPyCaret、AWSが開発したAutoGluon、Microsoft社のNNI(Neural Network Intelligence)、遺伝的プログラミングを使用して最適なパイプラインを構築するTPOTなども同等の機能を備えています。ソースコードを1行も記述することなく、GUIのみでAutoMLができるOSSは、現時点でH2O以外にはありません。

TOPに戻る

関連OSS

  • PyCaret
  • Keras
  • MXNet
  • NNI(Neural Network Intelligence)
  • Chainer

TOPに戻る

H2Oのサポート

NRIではお客様のご要望に応じて様々な支援ができるサービスをご用意しました。
詳細は下記ページをご確認ください。

TOPに戻る

OpenStandiaに関する
資料請求・お問い合わせはこちら

  • 資料請求
  • お問い合わせ

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

  • OpenStandiaサポート対象オープンソース|50種類以上のOSSのサポートをご提供します。
  • 人気midPoint
  • 人気Keycloak
  • 注目MongoDB
  • ForgeRock AM(OpenAM)
  • ForgeRock IDM(OpenIDM)
  • MongoDB
  • Postfix
  • Apache HTTP Server
  • ZABBIX
  • PostgreSQL
  • Apache Struts
  • Apache Kafka
  • Apache Hadoop
  • Apache Spark
  • Spring Framework
  • Apache Tomcat
  • Solr
  • iBATIS
  • DRBD
  • MySQL
  • JBoss
  • Ruby on Rails
  • Jaspersoft
  • OpenLDAP
  • Apache log4j
  • Apache Subversion
  • ForgeRock DS(OpenDJ)
  • Pacemaker
  • Samba
  • Red Hat Enterprise Linux
  • Nginx
  • BIND
  • Dovecot
  • Pentaho
  • sendmail
  • Courier-IMAP
  • ForgeRock DS(OpenDJ)
  • Heartbeat
  • Hibernate
  • Hinemos
  • MyBatis
  • MySQL Cluster
  • Apache Axis2
  • Squid
  • OpenSSO