




Resumo: A Intermedia procura Engenheiros de Confiabilidade de Site para garantir a confiabilidade, disponibilidade, escalabilidade e desempenho de aplicações e serviços críticos, aplicando princípios de engenharia às operações. Pontos principais: 1. Focar na melhoria da confiabilidade das aplicações e da excelência operacional 2. Colaborar além dos limites entre aplicações, plataformas e operações 3. Definir, medir e manter indicadores de nível de serviço (SLIs), objetivos de nível de serviço (SLOs) e orçamentos de erro ### **Descrição** **\*\*TODOS OS CANDIDATOS DEVEM RESIDIR EM PORTUGAL\*\*** *Oferecemos um modelo híbrido de trabalho, com um escritório em Coimbra e planos de abrir escritórios em Aveiro e Porto no futuro. Esta abordagem oferece aos membros da equipa flexibilidade para trabalhar remotamente, ao mesmo tempo que se reúnem presencialmente no escritório para colaboração e trabalho em equipa.* **Sobre a função** Os Engenheiros de Confiabilidade de Site (SREs) da Intermedia desempenham um papel crítico na garantia da confiabilidade, disponibilidade, escalabilidade e desempenho das nossas aplicações e serviços mais importantes. Como SRE na Intermedia, irá focar-se na melhoria da confiabilidade das aplicações e da excelência operacional, trabalhando em estreita colaboração com as equipas de engenharia de software, plataforma e DevOps para projetar, monitorizar, automatizar e melhorar continuamente a estabilidade dos serviços. Aplicará princípios de engenharia às operações, reduzirá esforços manuais, reforçará a observabilidade e minimizará o tempo de inatividade, garantindo que os nossos serviços sejam resilientes e estejam sempre prontos para apoiar os nossos clientes. Esta função é especialmente adequada para alguém com perfil prático, altamente analítico e confortável a trabalhar além dos limites entre aplicações, plataformas e operações, com o objetivo de melhorar a confiabilidade em produção à escala.### **Principais responsabilidades** * Garantir a disponibilidade, desempenho e confiabilidade de aplicações e serviços críticos, concebendo e implementando estratégias robustas de monitorização, alerta e otimização. * Definir, medir e manter indicadores de nível de serviço (SLIs), objetivos de nível de serviço (SLOs) e orçamentos de erro para apoiar os objetivos de confiabilidade dos serviços. * Colaborar com equipas de desenvolvimento para melhorar o desempenho, reduzir a latência e aumentar a resiliência das aplicações em produção. * Trabalhar em estreita colaboração com equipas de plataforma e DevOps para assegurar uma integração harmoniosa entre a infraestrutura e a confiabilidade das aplicações. * Definir padrões de confiabilidade e salvaguardas operacionais para capacidades da plataforma e caminhos recomendados (golden paths). * Colaborar com equipas de engenharia de plataforma para conceber capacidades de autoatendimento resilientes. * Automatizar tarefas operacionais, tais como implementações, reversões, dimensionamento, failover e processos de recuperação. * Melhorar continuamente os pipelines CI/CD para reduzir intervenções manuais e apoiar práticas de entrega seguras e progressivas. * Integrar validações automatizadas, verificações de confiabilidade e salvaguardas operacionais nos fluxos de trabalho de desenvolvimento e implementação. * Implementar e manter capacidades de observabilidade em sistemas de produção, incluindo métricas, registos (logs), rastreamentos (traces) e dashboards. * Desenvolver dashboards, alertas e vistas operacionais que forneçam visibilidade em tempo real sobre a saúde do sistema e o comportamento das aplicações. * Atuar como principal interventor durante incidentes, colaborando com várias equipas para diagnosticar, mitigar e resolver problemas em produção. * Realizar análises de causa raiz para incidentes e impulsionar ações corretivas de longo prazo para evitar recorrências. * Realizar simulações de emergência (fire drills), exercícios de “game days” e engenharia do caos para validar a resiliência do sistema sob condições de falha. * Monitorizar a utilização de recursos, tendências de capacidade e comportamento de dimensionamento para apoiar o crescimento futuro e as necessidades de desempenho. * Colaborar com equipas de segurança para garantir que os serviços estejam alinhados com as melhores práticas de segurança, incluindo comunicação segura, controlos de acesso e proteção de dados. * Liderar ou contribuir para reuniões regulares de prontidão em produção e revisões operacionais, para avaliar a saúde do sistema, rever incidentes e preparar lançamentos. * Promover as melhores práticas de engenharia de confiabilidade entre as equipas e ajudar a reforçar a maturidade operacional global da organização. ### **Competências, conhecimentos e experiência** * Licenciatura em Ciência da Computação, Engenharia ou área relacionada, ou experiência prática equivalente. * Experiência comprovada em Engenharia de Confiabilidade de Site, Engenharia de Plataforma ou funções de Infraestrutura/DevOps, com forte responsabilidade operacional. * Grande experiência em monitorização de aplicações, plataformas de observabilidade, resposta a incidentes e resolução de problemas em ambientes de produção. * Bom entendimento dos conceitos de engenharia de confiabilidade, tais como SLIs, SLOs, orçamentos de erro, qualidade dos alertas e gestão de incidentes. * Domínio de scripts e automação com ferramentas e linguagens como Python, Bash, Terraform, Ansible ou similares. * Experiência com plataformas em nuvem, tais como AWS, Azure ou Google Cloud. * Bom conhecimento de pipelines CI/CD, automação de implementações e práticas de entrega progressiva. * Bom conhecimento de infraestrutura como código (infrastructure as code) e abordagens de gestão de configuração. * Experiência com contenção e orquestração, tais como Docker e Kubernetes. * Excelentes capacidades de resolução de problemas, julgamento operacional e atenção aos detalhes. * Excelentes competências de comunicação e colaboração, com capacidade de trabalhar eficazmente com equipas de engenharia, plataforma e segurança. **Competências adicionais*** Experiência em práticas e ferramentas de engenharia do caos. * Experiência no apoio a plataformas internas ou equipas de engenharia de plataforma. * Familiaridade com portais de desenvolvedores, caminhos recomendados (golden paths), catálogos de serviços ou padrões de plataformas de autoatendimento. * Compreensão das métricas de experiência de desenvolvedores e da maturidade operacional de plataformas internas. * Familiaridade com arquiteturas de microsserviços e ambientes multi-inquilino (multi-tenant). * Experiência com stacks modernas de observabilidade e padrões de telemetria. * Compreensão de plataformas UCaaS e CCaaS, especialmente fluxos de serviços de voz e comunicação. * Experiência na liderança de iniciativas de confiabilidade, revisões de incidentes ou programas de melhoria em produção. * Familiaridade com planeamento de capacidade, testes de resiliência e práticas de prontidão operacional. ### **Diversidade, inclusão e igualdade de oportunidades** Contratamos, promovemos e remuneramos os funcionários com base na sua capacidade de desempenhar as responsabilidades do cargo, sem consideração de raça, cor, credo, religião, sexo, género, estado civil, origem nacional, ascendência, idade, cidadania, deficiência física ou mental, orientação sexual ou qualquer outra base protegida pela legislação aplicável (coletivamente referidas no nosso Código de Conduta como “Classes Protegidas”). Não toleramos discriminação no local de trabalho e estamos comprometidos em proporcionar adaptações razoáveis para deficiências identificadas ou outras limitações, conforme exigido por todas as leis aplicáveis. Somos um empregador que promove a igualdade de oportunidades e valoriza a diversidade na nossa empresa. Não discriminamos com base em raça, religião, cor, origem nacional, género, orientação sexual, idade, estado civil, condição de veterano ou deficiência.### **Sobre a Intermedia Intelligent Communications** Para explorar outras oportunidades, visite a nossa página de carreiras: https://www.intermedia.com/about\-us/careers


