開発者のための実践的SRE

【ロールモデルを見つけよう】SREに関して著名な人達をまとめてみた

2025年 5月 26日 月曜日

SRE キャリア Kubernetes

こんにちは!Kubernetes 勉強中のまきぞうです。 SRE の卵としていろんな技術をキャッチアップしているわけですが、技術のキャッチアップだけをして良いのか?と感じたんですよね。。。

  • 「この先 SRE としてどんな方向に進んでいこうか?」
  • 「キャリアの進む先にはどんな世界があるのか?」

そう思ったので、キャリアのロールモデルとなる人について調査してみました。

それぞれがどんな課題意識を持ち、どのようにして道を切り拓いてきたのか、その物語形式でまとめてみました。彼らの軌跡を辿れば、キャリアのロールモデルを見つける、またはヒントを得ることができるでしょう。


【海外編】SRE の歴史と哲学を築いた創造者たち

【SRE の創始者】Ben Treynor Sloss

彼の物語

彼の物語は、Google 社内のあるシンプルな疑問から始まります。

「なぜ、サービスを開発するチームと、それを運用するチームは対立しなければならないんだ?」

開発は新機能をどんどん出したい、でも運用は安定性を守りたい。

この永遠の課題を解決するため、彼は立ち上がりました。

2003 年、彼は 7 人のソフトウェアエンジニアからなる新しいチームを率いることになります。

彼のアイデアは革命的でした。

「運用の問題を、ソフトウェアエンジニアリングの力で解決しよう」。

手作業の運用(トイル)を徹底的に自動化し、開発と共通の目標(エラーバジェット)を持つことで、両者の対立構造を壊し、協力関係を築き上げたのです。

これが 「Site Reliability Engineering」 の誕生の瞬間でした。

Profile

  • 得意分野: SRE の哲学と組織論、DevOps 文化の構築
  • 主な功績:
    • Google での SRE チーム創設と命名
    • SRE の基本概念(エラーバジェット、トイルなど)の提唱
  • 書籍: 『Site Reliability Engineering』序文

【SRE の伝道師】 Niall Richard Murphy

彼の物語

もし SRE が口伝の文化のままだったら、ここまで世界に広がることはなかったかもしれません。

その知識を誰もが学べる"聖書(バイブル)"として編纂したのが、Niall Richard Murphy です。

彼は Google、Microsoft、Amazon という、世界の Web を支える巨大テック企業を渡り歩き、大規模システムの信頼性を追求し続けてきました。

Google で SRE の文化を目の当たりにした彼は、そのプラクティスを体系化し、世界中のエンジニアと共有することに情熱を注ぎます。

そして、Ben Treynor Sloss らと共に、あの金字塔 『Site Reliability Engineering』、通称"SRE 本"を世に送り出しました。

彼の功績なくして、今日の SRE の発展は語れません。

Profile

  • 得意分野: 大規模システム設計、SRE プラクティスの体系化
  • 主な著書:
    • 『Site Reliability Engineering』の編集・執筆
    • 『The Site Reliability Workbook』の編集・執筆
  • SNS:

【オブザーバビリティの探求者】 Liz Fong-Jones

彼の物語

システムが巨大で複雑になるほど、内部で何が起きているのか把握するのは難しくなります。

「問題が起きてから調査する」従来のモニタリングに限界を感じていたのが、Liz Fong-Jones でした。

彼女は「システムが今、どんな状態にあるのかを"質問"できる能力こそが重要だ」と考えます。

この 「オブザーバビリティ(可観測性)」 という概念を、彼女は自身のブログや数多くの講演を通じて世界に広めました。

未知の障害に直面したとき、膨大なデータの中から仮説を立て、素早く検証する。この「オブザーバビリティ・ドリブンな開発」を提唱し、現在は Honeycomb 社の Field CTO として、その実践を世界中で支援しています。

Profile

  • 得意分野: オブザーバビリティ、分散トレーシング、SRE 文化
  • 主な功績:
    • 書籍『Observability Engineering』の共著者
    • オブザーバビリティ分野のソートリーダーとしての活動
  • SNS:

【国内編】日本の SRE シーンを牽引する実践者たち

【日本の SRE 黎明期を切り拓いたパイオニア】長野 雅広

彼の物語

Perl ハッカーとしてキャリアを歩み始めた彼が、一貫して向き合ってきたのは Web サービスの「パフォーマンス」と「信頼性」でした。

その探求心は、後に日本のトップエンジニアが集う高速化コンテスト 「ISUCON」 の創設へと繋がっていきます。

彼のキャリアのハイライトの一つが、フリマアプリ「メルカリ」での挑戦です。

まだ日本で SRE が一般的でなかった時代に、彼は国内企業としては最初期となる本格的な SRE チームをゼロから立ち上げました。

「一行のログの向こうには、一人のユーザがいる」

この有名な言葉は、技術の先にあるユーザー体験を何よりも大切にする彼の信念を表しています。

Profile

  • 得意分野: SRE 組織の立ち上げ、Web アプリケーションのパフォーマンスチューニング
  • 主な功績:
    • メルカリでの SRE チーム創設と文化醸成
    • ISUCON (Iikanjini Speed Up Contest) の創設に関与
  • SNS:

【絶対王者にして凄腕 OSS 開発者】藤原 俊一郎

彼の物語

彼の名を世に知らしめたのは、何と言っても「ISUCON」での圧倒的な実績でしょう。

制限時間内にアプリケーションのボトルネックを特定し、コード、ミドルウェア、OS の全てに手を入れて改善していく様は、まさに圧巻。

複数回の優勝経験は、彼が卓越したパフォーマンスチューニング技術を持つことの証明です。

しかし、彼のすごさはそれだけではありません。

彼は優れた OSS 開発者 でもあります。特に Go 言語を好み、AWS の運用を劇的に効率化する「lambroll」や「ecsta」といったツールを自ら開発し、公開しています。

日々の運用で感じた「面倒」や「不便」を、自らの手でコードを書いて解決し、しかもそれをコミュニティに還元する。

まさに SRE のお手本のようなエンジニアです。

Profile

  • 得意分野: Go によるインフラ運用ツール開発、AWS 環境の SRE 実践、パフォーマンスチューニング
  • 主な功績:
    • ISUCON での複数回優勝
    • AWS 運用を効率化する多数の OSS を開発・公開
  • SNS:

【SRE の哲学を伝える"翻訳家】山口 能迪

彼の物語

SRE には「SLO」や「エラーバジェット」など、多くの専門用語が登場します。

海外で生まれたこれらの概念は、そのままでは日本の開発現場に馴染みにくいことも。

この SRE の哲学や概念を、日本のエンジニアに分かりやすく、丁寧に伝えてくれているのが、Google のデベロッパーリレーションズエンジニアである山口能迪さんです。

彼の役割は、単なる技術の解説者ではありません。なぜ SRE が必要なのか、それを導入することで開発チームはどう変わるのか、その本質的な価値を伝える "翻訳家" です。

彼のブログや講演を通じて、多くの日本のエンジニアが SRE への第一歩を踏み出しました。

海外の先進的な知見と、日本の現場をつなぐ、非常に重要な存在です。

Profile

  • 得意分野: SRE/DevOps の概念普及、クラウドネイティブ技術の解説
  • 主な功績:
    • ブログや講演を通じた日本国内での SRE 概念の普及活動
    • Google Cloud の SRE 関連サービスの啓蒙
  • SNS:

いかがでしたでしょうか。 著名な人がどんな事をしているのか、どんな経験を経て今に至っているのかを知ることで、自分の行動の参考にしてみると、「何をしたら良いのかわからない」という問題から脱却できると思います。 最後まで読んでいただき、ありがとうございました!