「Kafka」(カフカ)とはシステム間のデータを一時的に保持し、受け渡しを行う分散メッセージキューです。
Kafkaは複数台のサーバでクラスタを構成して分散処理を行うため、高いスループットを発揮します。
また、サーバ追加(スケールアウト)により、処理性能とメッセージ保持容量に対する高い拡張性を有しています。
一般的なクライアント / サーバシステム においては、サーバがクライアントにデータを送信する「Push型」、
クライアントがサーバにデータを取得しにいく「Pull型」がありますが、
KafkaはPull型(Publish / Subscribeモデル)の分散メッセージキューとなります。
Kafkaの導入によりシステム間のデータの受け渡しを非同期化することで、送信元システムからの急激な
データ増加に伴うシステムの負荷上昇を抑制することが可能になります。
Kafkaには以下の特徴があります。
Kafkaはシステム間の交通整理を行うデータハブとしての使い方の他に、ストリーミングシステムにも活用されています。
フロントシステムから送信されてくる大量のリアルタイムデータを処理するために、Hadoop / Spark Streamingと
連携したストリーミングアプリケーションの構成が多く利用されています。
ケース1
◆ 顧客ビジネス: | イベント会場における準リアルタイムでの混雑状況の可視化・予測 |
◆ 活用シーン: |
会場内のセンサーを利用してリアルタイムに位置情報収集 1分間に数万メッセージ送信される情報をSpark Streamingでマイクロバッチ処理 |
◆ 導入効果:
ケース2
◆ 顧客ビジネス: | 製造業における電子機器の製造販売 |
◆ 活用シーン: |
工場内の製造ラインや装置内のセンサーから、大量かつ高頻度で発生するセンサーデータの リアルタイム監視による異常検知や、データ分析による製造品質の改善 |
◆ 導入効果:
OpenStandiaではApache Kafka のサポートサービスを提供しています。
お気軽にOpenStandiaまでお問い合わせください。
●オープンソースソフトウェア年間サポートサービス詳細
●技術支援サービス詳細
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。