Navegar
···
Entrar / Registrar

Engenheiro de Confiabilidade de Site - IDP

Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
R. Quebra Costas 1, 3000-179 Coimbra, Portugal
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: A Intermedia procura um Engenheiro de Confiabilidade de Site para garantir a confiabilidade, disponibilidade, escalabilidade e desempenho de aplicações e serviços críticos. Pontos principais: 1. Desempenhar um papel crítico na garantia da confiabilidade, disponibilidade e desempenho. 2. Melhorar a confiabilidade das aplicações e a excelência operacional. 3. Função prática e altamente analítica para melhorar a confiabilidade em produção em larga escala. ### **Descrição** **\*\*TODOS OS CANDIDATOS DEVEM RESIDIR EM PORTUGAL\*\*** *Oferecemos um modelo híbrido de trabalho, com um escritório em Coimbra e planos de abrir escritórios em Aveiro e Porto no futuro. Esta abordagem oferece aos membros da equipa flexibilidade para trabalharem remotamente, ao mesmo tempo que se reúnem presencialmente no escritório para colaboração e trabalho em equipa.* **Sobre o cargo** Os Engenheiros de Confiabilidade de Site (SREs) da Intermedia desempenham um papel crítico na garantia da confiabilidade, disponibilidade, escalabilidade e desempenho das nossas aplicações e serviços mais importantes. Como SRE na Intermedia, concentrar-se-á na melhoria da confiabilidade das aplicações e na excelência operacional, trabalhando em estreita colaboração com as equipas de engenharia de software, plataforma e DevOps para projetar, monitorizar, automatizar e melhorar continuamente a estabilidade dos serviços. Aplicará princípios de engenharia às operações, reduzirá esforços manuais, reforçará a observabilidade e minimizará o tempo de inatividade, garantindo que os nossos serviços sejam resilientes e estejam sempre prontos para apoiar os nossos clientes. Este cargo é ideal para alguém que seja prático, altamente analítico e confortável a trabalhar transversalmente entre aplicações, plataformas e operações para melhorar a confiabilidade em produção em larga escala.### **Principais responsabilidades** * Garantir a disponibilidade, desempenho e confiabilidade de aplicações e serviços críticos, concebendo e implementando estratégias robustas de monitorização, alerta e otimização. * Definir, medir e manter indicadores de nível de serviço (SLIs), objetivos de nível de serviço (SLOs) e orçamentos de erro para apoiar os objetivos de confiabilidade dos serviços. * Colaborar com as equipas de desenvolvimento para melhorar o desempenho, reduzir a latência e aumentar a resiliência das aplicações em produção. * Trabalhar em estreita colaboração com as equipas de plataforma e DevOps para assegurar uma alinhamento fluido entre a infraestrutura e a confiabilidade das aplicações. * Definir padrões de confiabilidade e salvaguardas operacionais para capacidades de plataforma e caminhos dourados. * Colaborar com as equipas de engenharia de plataforma para projetar capacidades de autoatendimento resilientes. * Automatizar tarefas operacionais, tais como implementações, reversões, escalonamento, failover e processos de recuperação. * Melhorar continuamente os pipelines de CI/CD para reduzir a intervenção manual e apoiar práticas seguras e progressivas de entrega. * Integrar validações automatizadas, verificações de confiabilidade e salvaguardas operacionais nos fluxos de trabalho de desenvolvimento e implementação. * Implementar e manter capacidades de observabilidade em sistemas de produção, incluindo métricas, registos, rastreamentos e dashboards. * Desenvolver dashboards, alertas e vistas operacionais que forneçam visibilidade em tempo real sobre a saúde do sistema e o comportamento das aplicações. * Atuar como principal interventor durante incidentes, colaborando com várias equipas para diagnosticar, mitigar e resolver problemas em produção. * Realizar análises de causa raiz de incidentes e impulsionar ações corretivas de longo prazo para evitar recorrências. * Realizar exercícios de simulação de falhas (fire drills), dias de jogos (game days) e engenharia do caos para validar a resiliência do sistema sob condições de falha. * Monitorizar a utilização de recursos, tendências de capacidade e comportamento de escalonamento para apoiar o crescimento futuro e as necessidades de desempenho. * Colaborar com as equipas de segurança para garantir que os serviços estejam alinhados com as melhores práticas de segurança, incluindo comunicação segura, controlos de acesso e proteção de dados. * Liderar ou contribuir para reuniões regulares de prontidão em produção e revisões operacionais para avaliar a saúde do sistema, rever incidentes e preparar lançamentos. * Promover as melhores práticas de engenharia de confiabilidade entre as equipas e ajudar a reforçar a maturidade operacional global da organização. ### **Competências, conhecimentos e especialização** * Licenciatura em Ciência da Computação, Engenharia ou área afim, ou experiência prática equivalente. * Experiência comprovada em Engenharia de Confiabilidade de Site, Engenharia de Plataforma ou funções de Infraestrutura/DevOps, com forte responsabilidade operacional. * Excelente domínio de monitorização de aplicações, plataformas de observabilidade, resposta a incidentes e resolução de problemas em ambientes de produção. * Bom entendimento de conceitos de engenharia de confiabilidade, tais como SLIs, SLOs, orçamentos de erro, qualidade de alertas e gestão de incidentes. * Domínio de scripts e automação utilizando ferramentas e linguagens como Python, Bash, Terraform, Ansible ou semelhantes. * Experiência com plataformas em nuvem, tais como AWS, Azure ou Google Cloud. * Excelente conhecimento de pipelines de CI/CD, automação de implementações e práticas de entrega progressiva. * Excelente conhecimento de infraestrutura como código e abordagens de gestão de configuração. * Experiência com conteinerização e orquestração, tais como Docker e Kubernetes. * Excelentes capacidades de resolução de problemas, julgamento operacional e atenção aos detalhes. * Excelentes competências de comunicação e colaboração, com capacidade de trabalhar eficazmente com equipas de engenharia, plataforma e segurança. **Competências adicionais*** Experiência em práticas e ferramentas de engenharia do caos. * Experiência no apoio a plataformas internas ou equipas de engenharia de plataforma. * Familiaridade com portais de desenvolvedores, caminhos dourados, catálogos de serviços ou padrões de plataformas de autoatendimento. * Compreensão de métricas de experiência de desenvolvedores e maturidade operacional para plataformas internas. * Familiaridade com arquiteturas de microsserviços e ambientes multi-inquilino. * Experiência com stacks modernas de observabilidade e padrões de telemetria. * Compreensão de plataformas UCaaS e CCaaS, especialmente fluxos de serviços de voz e comunicação. * Experiência na liderança de iniciativas de confiabilidade, revisões de incidentes ou programas de melhoria em produção. * Familiaridade com planeamento de capacidade, testes de resiliência e práticas de prontidão operacional. ### **Diversidade, inclusão e igualdade de oportunidades** Contratamos, promovemos e remuneramos os funcionários com base na sua capacidade de desempenhar as suas responsabilidades profissionais, sem consideração de raça, cor, credo, religião, sexo, género, estado civil, origem nacional, ascendência, idade, cidadania, deficiência física ou mental, orientação sexual ou qualquer outra base protegida pela legislação aplicável (coletivamente referidas no nosso Código de Conduta como “Classes Protegidas”). Não toleramos discriminação no local de trabalho e estamos empenhados em proporcionar adaptações razoáveis para deficiências identificadas ou outras limitações, conforme exigido por todas as leis aplicáveis. Somos um empregador que oferece igualdade de oportunidades e valorizamos a diversidade na nossa empresa. Não discriminamos com base em raça, religião, cor, origem nacional, género, orientação sexual, idade, estado civil, estatuto militar ou deficiência.### **Sobre a Intermedia Intelligent Communications** Para explorar outras oportunidades, consulte a nossa página de carreiras: https://www.intermedia.com/about\-us/careers

Fonte da Informação:  indeed Ver publicação original
João Santos
Indeed · HR

Empresa

Indeed
João Santos
Indeed · HR

Vagas semelhantes

Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com