OpenStackを担当しているソリューションアーキテクトの輿水です。
4/28(火)〜4/30(木)に開催されたRed Hat Summit 2020 のセッション「The next evolution of Red Hat OpenStack Platform」の内容を元に最新版のRed Hat OpenStack Platform(以降RHOSPとします)について記載します。
Service Telemetry Framework (STF)
STFとはサービス保証のために、低遅延・高スケールでメトリクスやイベントをハンドリングし、ポリシーやプロセスを適用することができるプラットフォームです。RHOSP 13からテクノロジープレビューとして実装されています。
Red Hat Service Telemerty Frameworkの利点として考えられるのは次の項目です。
Capability at scale
- 必要に応じて1秒未満の間隔でメトリクスやイベントを収集
- 複数のソース(クラウド等)からメトリクスやイベントを集めて集中管理
Better data gathering
- 複数のソースからほぼリアルタイムでデータを収集
- kernel/cpu/nfvなど様々なレベルでインフラをモニタリング
- NFVアプリケーションのための多彩なライブラリー(collectd plugin)
Enhansed access
- 複数のレベル(センサー、メッセージバス、管理クラスタ等)のAPIを用いて、メトリクスやイベントにアクセス可能で、柔軟性が高い
- 精巧なアラートの仕組みを提供
Flexible monitoring platform
- 複数のクラウドのための、モニタリングクラスタの高可用性
- 将来的に発展するクラウドプラットフォームへの取り組み
STFでアラート対応を行っているデモがありますので、御覧ください。(外部リンク)
アーキテクチャ概要
STFはRed Hat Openshift Container Platform上で稼働するアプリケーションであり、以下のコンポーネントを利用します。OpenShiftとAMQはOpenStackサブスクリプションの一部として提供されます。OpenStack Directorによりインストールされ、OpenShift で管理されます。
- collected : メトリクス収集
- Prometheus:時系列データのストレージ
- ElasticSearch:イベントデータのストレージ
- AMQP(AMQ Interconnect API)こ :Prometheusにデータを送るためのメッセージバス
- Smart gateway:AMQPからメトリクスとイベントをピックアップし、ElasticSearchにイベント、Prometheusにメトリクスを引き渡す
STFを利用することで、複数のOpenStackクラウドのイベントやメトリクスの収集と管理を集中して行えます。別の記事で述べたDistributed Compute Nodes (DCN)の環境についても、各DCNのエッジサイトのOpenStack Computeの情報をプライマリーサイトのControllerに集めてSTFで管理することが可能になります。
Red Hat Service Telemerty Framework FAQ
Red Hat Service Telemerty Frameworkはいつから利用可能ですか?
RHOSP 13からテクノロジープレビューとして利用可能です。RHOSP 16においても6月末時点でテクノロジープレビューですが、近日GA予定です。
Red Hat OpenShift PlatformとAMQ Interconnectサブスクリプションを購入する必要がありますか?
いいえ。3ノードのRed Hat OpenShift Platform とAMQ Interconnectは標準OpenStackサブスクリプションの一部であるため、必要ありません。新しいノードを追加するときは無料でリクエストできます。ただしSTFでの利用に限ります。
既存のRed Hat OpenShift Platformがある場合、STFに利用できますか?
はい。既存のOCPクラスターに制限がない限り、STFに使用できます
商用環境でSTFを利用するためには、いくつの物理ノードが必要ですか?
OSPクラウドが実行されているノード以外に、OpenShiftをデプロイしてSTFをインストールするための少なくとも3台の物理ノードが必要です
GrafanaはRed Hat Service Telemerty Frameworkに含まれていますか?
いいえ。現在はRed Hat Service Telemerty Frameworkには含まれてはいませんが、Grafanaにインポートして必要に応じてカスタマイズでできるダッシュボードをいくつか提供しています、
ElasticSearchはRed Hat Service Telemerty Frameworkに含まれていますか?
いいえ。STF operatorはElasticSearchのoperetorは含まれていません。しかし、多くのユーザーがElasticSearchを利用しているため、ユーザーがElasticSearchのoperetorをOCP向けに利用できるようにするためのドキュメントを考えています。
collectdプラグインのリストはありますか?
https://access.redhat.com/documentation/en-us/red_hat_openstack_platform/16.0/html/service_telemetry_framework/appe-stf-collectd-plugins access.redhat.com
STFはマルチクラウドをサポートしていますか?
はい。複数のOpenStack環境がひとつのSTFを指定するように設定できます。
STFはSNMPトラップ通知をサポートしますか?
現時点で、STF側のAlertManagerはサポートされていませんが、STFトラップ通知は今後予定されています。一方では、OpenStackアラームサービス(Aodh)を使用しsnmptrapの宛先を指すようにアラームアクションを構成できます。
STFはCephメトリクスをサポートしていますか?
はい。Cephを含むすべてのOSPノードからのOpenStack TelemetryだけでなくCollectdプラグインで収集されたメトリクスとイベントをSTFに送信することが出来ます。しかしながら、現時点ではCephメトリクスを直接利用はできません。今後実装の予定はあります。
STFにCentralized Loggingは含まれますか?
現時点では含まれませんが、今後に予定されています。
Smart Gatewayにはどの技術が使われていますか?
Smart GatewayはAnsible OperatorによってデプロイされたGolangアプリケーションです。
STFはどのロードバランサーを使用しますか?
ロードバランサーはOCPの実装によってハンドリングされます。
STFでサポートされているマルチテナンシーはありますか?
現在、STF自体はテナントに対応するシステムではありません。テナント情報は、Ceilometerなどの収集エージェントから提供されたデータからフィルターできます。