Above & Beyond

日々のアウトプット記録

Rancher Meetup Tokyo #18(モニタリングについて語ろう会)

03/19(火) は「Rancher Meetup Tokyo #18(モニタリングについて語ろう会)」に参加してきました。

rancherjp.connpass.com

f:id:kabukawa:20190317133048p:plain

会場は リクルートテクノロジーズ さん。

f:id:kabukawa:20190321213328j:plain


目次


Rancher Meetup Tokyo

前回(と言っても去年の10月ですが)はリモート参加だったので、リアル参加は久しぶりです。

kabukawa.hatenablog.jp


プログラム

時間帯 発表者 発表タイトル
19:00-19:10 @tsukaman オープニング
19:10-19:35 @cyberblack28 Prometheus integrated in Rancher
19:35-20:00 @takao3 Sysdig クラウドネイティブ インテリジェンス プラットフォームのご紹介
20:00-20:15 - Networking Time
20:15-20:40 @songmu 監視 入門
20:40-20:50 @jacopen Feedback from Cloud Native Deep Dive - みんなのモニタリングお悩み共有
20:50-20:55 @ryota_hnk 今後の活動など

内容


Prometheus integrated in Rancher

@cyberblack28 さん

speakerdeck.com

Rancharのモニタリングとロギングの機能、そしてRancher 2.2 における Multi-Tenant Prometheus、Multi-Cluster Apps についての内容。


Rancherについては、スピーカーである @cyberblack28 さんの以下の連載で分かりやすく解説されているので、一読することをオススメします。

thinkit.co.jp


今回の内容

  1. 基本的なモニタリング機能
  2. アラートと通知
  3. 基本的なロギング機能
  4. モニタリングとロギングカタログ
  5. RancherのMulti-Tenant Prometheus の新規サポート
  6. Multi-Cluster Apps
  7. Information

今回のセッションでは Multi-Tenant Prometheus の 新規サポート と Multi-Cluster Apps が個人的には興味深かったので、資料の中からリンク部分を貼っておきます。


Multi-Tenant Prometheus

Introduction to Kubernetes Monitoring rancher.com

Rancher’s New Multi-Tenant Prometheus Support rancher.com

December 2018 Online Meetup Introducing Rancher's New Multi Tenant Prometheus Support www.youtube.com

Rancher v2.2.0-Alpha3 Multi-Tenant Prometheus Supportについて qiita.com


Multi-Cluster Apps

複数のKubernetesクラスタへアプリをまとめてデプロイ、ローリングアップデートなどの新機能を搭載した「Rancher 2.2」が登場 www.publickey1.jp

How Enterprise Kubernetes Benefits from Multi-Cluster Apps rancher.com

Introducing Multi-Cluster Applications in Rancher 2.2 Preview 2 rancher.com

February 2019 Online Meetup: Multi Cluster Applications, Global DNS, and Multi Tenant Catalogs www.youtube.com

Rancher 2.2 Tech Preview Multi-Cluster App qiita.com


お知らせ

Cloud Native Tokyo #01 〜コンテナオーケストレーションプラットフォーム特集〜

cnjp.connpass.com

CloudNative Days Fukuoka 2019

cloudnativedays.jp



Sysdig クラウドネイティブ インテリジェンス プラットフォームのご紹介

@takao3 さん

f:id:kabukawa:20190326234658p:plain

Sysdig.pdf - Google ドライブ

資料は上記ですが、以下のページに更に詳しく書かれていますので、こちらも併せてどうぞ。 (当日のセッション内容がそのまま書かれていると言っても良いくらい)

www.linkedin.com


Sysdigによるモニタリングについての内容。

Sysdigについて、このセッションを聞くまで知らなかったのですが、

  • ネットワークパケットのモニタリングツールであるWiresharkのContributorの方が作った
  • コンテナなどを含めたモニタリングのためのツール
  • システムコールレベルで監視
  • オープンソース版と商用版が有る
  • 商用版は Sysdig Monitor(Sysdig Cloud)と、不正アクティビティの検知やアクティビティに対する防御向けの Sysdig Secure というサービスが有る。

sysdig.com

www.youtube.com

コンテナやマイクロサービスを活用していくための技術的な課題

f:id:kabukawa:20190327000135p:plain:w500

f:id:kabukawa:20190327000144p:plain:w500


OSS版は以下。

Sysdig(Github) github.com

falco github.com


個人メモ

  • システムコールをすべてキャプチャ。ネットワークのパケットをすべてキャプチャするWiresharkと考え方は同じ。
  • 取り敢えずすべて取ってきてから、なんとかして可視化するアプローチ。
  • ユーザーランドで処理するとオーバーヘッドが有るのでカーネルランド側で処理を行うことで高速化
  • システムコールをトレースするので、不正侵入時もFileStreamレベルまですべて情報を確認可能
  • 情報を一番深いところから取ってくる、というアプローチだからこういう事ができる。
  • 14日間無料で試せるプランあり。

監視 入門

@songmu さん

songmu.github.io

はてなの提供するサーバーの監視サービスである Mackerelのプロダクトマネージャである @songmu さんによる監視についての話。


最近話題(空前の監視ブーム(笑))の「入門 監視」。@songmu さんは付録Cを執筆されたとのこと。

入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 監視 ―モダンなモニタリングのためのデザインパターン

はてなの提供するサーバーの監視サービスである Mackerel。最近コンテナ向けのエージェントがリリースされた。

mackerel.io


監視とテスト

監視とは本来システムに対する継続的なインテグレーションである developer.cybozu.co.jp

テストと監視

  • 開発者がテストを書くことは当たり前になった
  • 監視はどうか

モニタリングの重要性の向上

  • 監視とはシステムに対する高速健康診断

一般的な健康診断

  • 健康診断の結果
    • 分かる数値とわからない数値がある
  • システム監視も同じ
    • 分かる数値を追いかける/分かる数字を計測する

何を監視すれば良いのかを考える

  • 監視のコード化

チェック監視

  • OKかNGを判定する
  • OK/Warning/Critical/Unknown
  • コマンド終了ステータスで状態を判定

  • メトリック監視

  • 時系列データの以下を空白区切りで出力
    • キー
    • timestamp

tools.ietf.org

openmetrics.io

healthエンドポイント(モニタリング用のエンドポイント)

  • /health か /healthzとか
  • h2o等のHTTPサーバーで実装

開発者こそ監視する

  • アプリケーションに関しては開発した人こそが何を監視すればいいか知っているはず
  • 「不安な箇所」を監視する

監視しながら開発する

  • 雑でも良いのでチェックスクリプトを書く
  • 監視の口を開ける
  • health エンドポイントパターン

f:id:kabukawa:20190324001238p:plain

監視も同時に設計する

landing.google.com

  • USE Method (Internal / for Resouces)

www.brendangregg.com

詳解 システム・パフォーマンス

詳解 システム・パフォーマンス

  • RED Method (External / for Services)

www.weave.works

USEとRED

  • それぞれ補完しあうもの
    • USEは内部の挙動を観察するための指標
    • REDは外部からの振る舞いを観察するための指標
  • USEとREDを捉えることで、Four Golden Signalsが見えてくる。

f:id:kabukawa:20190324001822p:plain


mackerel-container-agent

github.com


個人メモ

  • 監視について、こうやって解説をしてもらったことで改めて監視と向き合う機会になった
  • 入門監視、買ったまま積読になっているので早く読まないと。
  • 監視は運用をする人だけでやるのではなく開発者自身もやる必要があるというところはメチャクチャ同意。
  • 誰がなにをどうやって監視するかということが大事。ツールを入れれば終わりというわけではない。

Feedback from Cloud Native Deep Dive - みんなのモニタリングお悩み共有

@jacopen さん

speakerdeck.com

Cloud Native Deep Diveという別コミュニティでのモニタリングに関する内容を共有していただきました。 ただ、10分という時間で聞くにはちょっとボリュームが有ったので、資料を見ながら復習したいと思います。

Cloud Native Deep Diveというコミュニティは「話を聞く」ではなく「全員が参加する」形ということなのでフィードバックされた内容を聞く限り、実務での経験や知見を持っていたり、悩んでいる人にとってはとても良いのではないかと思います。(自分のような初心者が参加するのはちょっと躊躇しますが、、、)

www.meetup.com

こうやって内容を共有してもらえると、ハマりどころと言うか、きちんと考えておかなければいけないところはどこなのかとかといった知見を得ることができるので、とても有り難いなぁと思いました。(今の自分にはそれを活かせる仕事が必要)


ギブアップしたLTネタを供養するエントリー

w4yh さん

本当はLTで話される予定だったそうですが、事情により参加できなくなったということで、スピーカー自身が発表内容をまとめたブログエントリを書かれています。

w4yh.hatenablog.com

読んだ内容をざっくり書くとこんな感じです

  1. グラフを印刷したい
  2. グラフから目で読み取るのか
    • ベースラインの値や周期変動って数式で表せるべきなので、以下のツールで検出させて1の仕掛けで出力
    • https://hastic.io/

これは是非ともデモを見てみたかったです。1の説明にある以下のところは元SIerとしてはわかり味しか無い。。。

SIヤーにとってはWebでダークテーマでインタラクティブにグラフが見られることよりも印刷して月次報告書としてご提出したい


まとめ

今回のテーマは「モニタリングについて語ろう会」ということで、Rancherの監視周りの話をたくさん聞くことができました。 また、監視の入門として、基本的な考え方や監視プラグインのフォーマットなどについてもお話を聞くことができてとても良かったです。

ありがとうございました!