こんにちは!Kubernetes 勉強中のまきぞうです。 SRE の卵としていろんな技術をキャッチアップしているわけですが、技術のキャッチアップだけをして良いのか?と感じたんですよね。。。
- 「この先 SRE としてどんな方向に進んでいこうか?」
- 「キャリアの進む先にはどんな世界があるのか?」
そう思ったので、キャリアのロールモデルとなる人について調査してみました。
それぞれがどんな課題意識を持ち、どのようにして道を切り拓いてきたのか、その物語形式でまとめてみました。彼らの軌跡を辿れば、キャリアのロールモデルを見つける、またはヒントを得ることができるでしょう。
【海外編】SRE の歴史と哲学を築いた創造者たち
【SRE の創始者】Ben Treynor Sloss
彼の物語
彼の物語は、Google 社内のあるシンプルな疑問から始まります。
「なぜ、サービスを開発するチームと、それを運用するチームは対立しなければならないんだ?」
開発は新機能をどんどん出したい、でも運用は安定性を守りたい。
この永遠の課題を解決するため、彼は立ち上がりました。
2003 年、彼は 7 人のソフトウェアエンジニアからなる新しいチームを率いることになります。
彼のアイデアは革命的でした。
「運用の問題を、ソフトウェアエンジニアリングの力で解決しよう」。
手作業の運用(トイル)を徹底的に自動化し、開発と共通の目標(エラーバジェット)を持つことで、両者の対立構造を壊し、協力関係を築き上げたのです。
これが 「Site Reliability Engineering」 の誕生の瞬間でした。
Profile
- 得意分野: SRE の哲学と組織論、DevOps 文化の構築
- 主な功績:
- Google での SRE チーム創設と命名
- SRE の基本概念(エラーバジェット、トイルなど)の提唱
- 書籍: 『Site Reliability Engineering』序文
【SRE の伝道師】 Niall Richard Murphy
彼の物語
もし SRE が口伝の文化のままだったら、ここまで世界に広がることはなかったかもしれません。
その知識を誰もが学べる"聖書(バイブル)"として編纂したのが、Niall Richard Murphy です。
彼は Google、Microsoft、Amazon という、世界の Web を支える巨大テック企業を渡り歩き、大規模システムの信頼性を追求し続けてきました。
Google で SRE の文化を目の当たりにした彼は、そのプラクティスを体系化し、世界中のエンジニアと共有することに情熱を注ぎます。
そして、Ben Treynor Sloss らと共に、あの金字塔 『Site Reliability Engineering』、通称"SRE 本"を世に送り出しました。
彼の功績なくして、今日の SRE の発展は語れません。
Profile
- 得意分野: 大規模システム設計、SRE プラクティスの体系化
- 主な著書:
- 『Site Reliability Engineering』の編集・執筆
- 『The Site Reliability Workbook』の編集・執筆
- SNS:
- X (Twitter): @niallm
【オブザーバビリティの探求者】 Liz Fong-Jones
彼の物語
システムが巨大で複雑になるほど、内部で何が起きているのか把握するのは難しくなります。
「問題が起きてから調査する」従来のモニタリングに限界を感じていたのが、Liz Fong-Jones でした。
彼女は「システムが今、どんな状態にあるのかを"質問"できる能力こそが重要だ」と考えます。
この 「オブザーバビリティ(可観測性)」 という概念を、彼女は自身のブログや数多くの講演を通じて世界に広めました。
未知の障害に直面したとき、膨大なデータの中から仮説を立て、素早く検証する。この「オブザーバビリティ・ドリブンな開発」を提唱し、現在は Honeycomb 社の Field CTO として、その実践を世界中で支援しています。
Profile
- 得意分野: オブザーバビリティ、分散トレーシング、SRE 文化
- 主な功績:
- 書籍『Observability Engineering』の共著者
- オブザーバビリティ分野のソートリーダーとしての活動
- SNS:
- Blog: lizthegrey.com
- X (Twitter): @lizthegrey
【国内編】日本の SRE シーンを牽引する実践者たち
【日本の SRE 黎明期を切り拓いたパイオニア】長野 雅広
彼の物語
Perl ハッカーとしてキャリアを歩み始めた彼が、一貫して向き合ってきたのは Web サービスの「パフォーマンス」と「信頼性」でした。
その探求心は、後に日本のトップエンジニアが集う高速化コンテスト 「ISUCON」 の創設へと繋がっていきます。
彼のキャリアのハイライトの一つが、フリマアプリ「メルカリ」での挑戦です。
まだ日本で SRE が一般的でなかった時代に、彼は国内企業としては最初期となる本格的な SRE チームをゼロから立ち上げました。
「一行のログの向こうには、一人のユーザがいる」
この有名な言葉は、技術の先にあるユーザー体験を何よりも大切にする彼の信念を表しています。
Profile
- 得意分野: SRE 組織の立ち上げ、Web アプリケーションのパフォーマンスチューニング
- 主な功績:
- メルカリでの SRE チーム創設と文化醸成
- ISUCON (Iikanjini Speed Up Contest) の創設に関与
- SNS:
- X (Twitter): @kazeburo
【絶対王者にして凄腕 OSS 開発者】藤原 俊一郎
彼の物語
彼の名を世に知らしめたのは、何と言っても「ISUCON」での圧倒的な実績でしょう。
制限時間内にアプリケーションのボトルネックを特定し、コード、ミドルウェア、OS の全てに手を入れて改善していく様は、まさに圧巻。
複数回の優勝経験は、彼が卓越したパフォーマンスチューニング技術を持つことの証明です。
しかし、彼のすごさはそれだけではありません。
彼は優れた OSS 開発者 でもあります。特に Go 言語を好み、AWS の運用を劇的に効率化する「lambroll」や「ecsta」といったツールを自ら開発し、公開しています。
日々の運用で感じた「面倒」や「不便」を、自らの手でコードを書いて解決し、しかもそれをコミュニティに還元する。
まさに SRE のお手本のようなエンジニアです。
Profile
- 得意分野: Go によるインフラ運用ツール開発、AWS 環境の SRE 実践、パフォーマンスチューニング
- 主な功績:
- ISUCON での複数回優勝
- AWS 運用を効率化する多数の OSS を開発・公開
- SNS:
【SRE の哲学を伝える"翻訳家】山口 能迪
彼の物語
SRE には「SLO」や「エラーバジェット」など、多くの専門用語が登場します。
海外で生まれたこれらの概念は、そのままでは日本の開発現場に馴染みにくいことも。
この SRE の哲学や概念を、日本のエンジニアに分かりやすく、丁寧に伝えてくれているのが、Google のデベロッパーリレーションズエンジニアである山口能迪さんです。
彼の役割は、単なる技術の解説者ではありません。なぜ SRE が必要なのか、それを導入することで開発チームはどう変わるのか、その本質的な価値を伝える "翻訳家" です。
彼のブログや講演を通じて、多くの日本のエンジニアが SRE への第一歩を踏み出しました。
海外の先進的な知見と、日本の現場をつなぐ、非常に重要な存在です。
Profile
- 得意分野: SRE/DevOps の概念普及、クラウドネイティブ技術の解説
- 主な功績:
- ブログや講演を通じた日本国内での SRE 概念の普及活動
- Google Cloud の SRE 関連サービスの啓蒙
- SNS:
- Blog: YAMAGUCHI::weblog
いかがでしたでしょうか。 著名な人がどんな事をしているのか、どんな経験を経て今に至っているのかを知ることで、自分の行動の参考にしてみると、「何をしたら良いのかわからない」という問題から脱却できると思います。 最後まで読んでいただき、ありがとうございました!