Site Reliability Engineer (SRE)

Full-time @Micepad

Job Description

 

我們正在尋找 SRE 可以幫助我們

  • 設計穩定的架構,提升系統可用性和可擴展性
  • 規劃並建置監控服務確保核心服務穩定運作,並針對問題進行故障排除
  • 協助優化一切可以提升工程團隊開發效率的工具和流程
  • 協助規劃和優化 on-call 流程和機制
  • 與開發工程師溝通,協助分析系統效能瓶頸
  • 與開發工程師溝通,持續優化並完善產品部署流程

 

職務需求

  • 3 年以上 DevOps 相關經驗
  • 熟悉服務監控和警告相關工具 (Prometheus, Grafana)
  • 熟悉日誌管理系統 (ELK, Cloud Logging)
  • 熟悉 CI/CD 流程設計
  • 具備 GCP 或 AWS 實務經驗(我們主要使用 GCP)
  • 具備 Docker 或 Kubernetes 相關能力
  • 具備 Infrastructure as Code 相關經驗 (Terraform, Ansible)
  • 具備自動化工具腳本撰寫能力
  • 具備基本英文聽、說、讀、寫能力

 

加分條件

  • 具備高可用性系統設計經驗
  • 具備災難復原設計經驗
  • 具備高流量負載設計經驗

 

面試流程

  1. 面試官和面試者自我介紹,針對履歷內容和經歷提問
  2. 技術相關問題
  3. 面試者提問