Job Description
我們正在尋找 SRE 可以幫助我們
- 設計穩定的架構,提升系統可用性和可擴展性
- 規劃並建置監控服務確保核心服務穩定運作,並針對問題進行故障排除
- 協助優化一切可以提升工程團隊開發效率的工具和流程
- 協助規劃和優化 on-call 流程和機制
- 與開發工程師溝通,協助分析系統效能瓶頸
- 與開發工程師溝通,持續優化並完善產品部署流程
職務需求
- 3 年以上 DevOps 相關經驗
- 熟悉服務監控和警告相關工具 (Prometheus, Grafana)
- 熟悉日誌管理系統 (ELK, Cloud Logging)
- 熟悉 CI/CD 流程設計
- 具備 GCP 或 AWS 實務經驗(我們主要使用 GCP)
- 具備 Docker 或 Kubernetes 相關能力
- 具備 Infrastructure as Code 相關經驗 (Terraform, Ansible)
- 具備自動化工具腳本撰寫能力
- 具備基本英文聽、說、讀、寫能力
加分條件
- 具備高可用性系統設計經驗
- 具備災難復原設計經驗
- 具備高流量負載設計經驗
面試流程
- 面試官和面試者自我介紹,針對履歷內容和經歷提問
- 技術相關問題
- 面試者提問