Navegar
···
Entrar / Registrar

Engenheiro de Confiabilidade de Site

€ 17.621/Mês
Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
PV49+C7 Lisboa, 1000-001, Portugal
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Esta função de Engenheiro SRE concentra-se em aprimorar a confiabilidade, operabilidade e observabilidade dos serviços de produção por meio de engenharia prática, trabalho operacional e melhoria contínua. Pontos principais: 1. Melhorar a confiabilidade, operabilidade e observabilidade dos serviços de produção. 2. Implementar e aprimorar capacidades de monitoramento para detecção proativa de problemas. 3. Operar de forma independente em tarefas complexas utilizando práticas de SRE. FAÇA HISTÓRIA CONOSCO! Na PMI, escolhemos fazer algo incrível. Estamos transformando totalmente nosso negócio e construindo nosso futuro com produtos sem fumaça, capazes de melhorar a vida de um bilhão de fumantes em todo o mundo. Com uma mudança tão grande, surgem grandes oportunidades. Portanto, independentemente de onde você se juntar a nós, desfrutará da liberdade para conceber e entregar soluções melhores e mais brilhantes, além do espaço necessário para impulsionar sua carreira em direções infinitamente diversas. **Finalidade da função** ---------------- A função de Engenheiro SRE concentra-se na melhoria da confiabilidade, operabilidade e observabilidade dos serviços de produção por meio de engenharia prática e trabalho operacional. A função combina responsabilidades operacionais diárias com atividades de melhoria contínua em monitoramento, alertas, suporte a incidentes, registro de logs e automação. O Engenheiro SRE trabalha em sistemas ativos e é esperado que investigue problemas de produção, solucione problemas complexos e implemente melhorias que tornem os serviços mais confiáveis e fáceis de operar. Isso inclui configurar e manter painéis, alertas, visualizações de logs e automações usando ferramentas SRE estabelecidas e práticas de infraestrutura como código. A função é orientada à execução e aplica padrões e estruturas definidos, em vez de definir a estratégia organizacional de confiabilidade. A função também inclui apoiar a adoção e o uso de SLIs e SLOs, implementando definições acordadas, garantindo fontes corretas de dados e ajudando as equipes a utilizar sinais de confiabilidade nas operações diárias. O foco está na implementação consistente e no uso operacional, não na propriedade do próprio framework de confiabilidade. Espera-se uma mentalidade orientada por IA. Isso significa compreender os conceitos e aplicações potenciais de capacidades assistidas por IA dentro das ferramentas SRE (por exemplo, detecção de anomalias, redução de ruído, correlação e suporte à automação) e ser capaz de trabalhar com recursos habilitados por IA, sempre que disponíveis. A função não exige a construção de modelos de IA, mas requer a capacidade de compreender como os recursos orientados por IA influenciam a observabilidade, os alertas e os fluxos de trabalho operacionais, bem como utilizá-los de forma responsável dentro das ferramentas existentes. Além disso, espera-se que o Engenheiro SRE interaja com fornecedores externos relacionados às ferramentas e plataformas SRE. Isso inclui atuar como ponto de contato técnico para tópicos operacionais, tais como solução de problemas, integrações, atualizações e uso de funcionalidades. A interação com fornecedores deve crescer progressivamente ao longo do tempo, começando com colaboração guiada e avançando rumo a uma propriedade técnica mais autônoma. No geral, a função destina-se a um engenheiro capaz de operar de forma independente em tarefas complexas, aplicar práticas SRE de maneira consistente, compreender ferramentas modernas de observabilidade e automação (incluindo capacidades assistidas por IA) e contribuir para a melhoria da confiabilidade por meio de mudanças práticas e mensuráveis. **Principais responsabilidades** ------------------------ * Monitoramento e observabilidade + Implementar e aprimorar capacidades de monitoramento para garantir visibilidade em tempo real e detecção proativa de problemas. + Projetar, desenvolver e manter painéis, alertas e telemetria de apoio. * Suporte a plantões e escalonamento + Melhorar o roteamento de alertas, políticas de escalonamento e integrações entre ferramentas de monitoramento e alertas. + Apoiar equipes de plataforma na adoção das melhores práticas de alertas e na redução do ruído gerado por alertas. * Suporte a incidentes e gerenciamento de problemas + Contribuir para a resolução de incidentes complexos por meio de solução estruturada de problemas e análise. + Apoiar a análise da causa raiz, documentação e ações corretivas para evitar recorrências. * Agregação e análise de logs + Aprimorar a ingestão, análise e visualização de logs usando ELK. + Criar painéis e alertas reutilizáveis com base em padrões de logs e sinais operacionais. * Implementação de SLO/SLI + Apoiar a definição e implementação de SLIs e SLOs. + Utilizar dados de confiabilidade e orçamentos de erro para orientar melhorias operacionais e de engenharia. * Infraestrutura como código e automação + Desenvolver e manter ativos Terraform/Terraform Enterprise, incluindo módulos reutilizáveis. + Automatizar processos de onboarding, configuração e fluxos de trabalho operacionais para reduzir esforços manuais. * Interação e gestão de fornecedores + Atuar como ponto de contato técnico para fornecedores relacionados a SRE (por exemplo, observabilidade, alertas, CI/CD). + Apoiar a incorporação de ferramentas, atualizações, integrações e resolução de problemas com fornecedores. + Participar de revisões com fornecedores, acompanhamentos e discussões sobre roadmaps juntamente com engenheiros seniores ou liderança. + Garantir que as soluções fornecidas pelos fornecedores estejam alinhadas com os padrões SRE, a estratégia de ferramentas e as necessidades operacionais. * Documentação e compartilhamento de conhecimento + Manter documentação técnica, runbooks e diretrizes operacionais. + Compartilhar conhecimento dentro da equipe SRE e contribuir para práticas repetíveis e escaláveis. **Capacidades obrigatórias** --------------------------- ### **Práticas SRE / Confiabilidade** * Conhecimento intermediário dos princípios e práticas SRE. * Capacidade de lidar com tarefas mais complexas e contribuir para a melhoria contínua dos processos. * Habilidades intermediárias de solução de problemas e troubleshooting em ambientes de produção. ### **Habilidades técnicas** * New Relic: configuração de monitoramento e alertas, incluindo painéis personalizados. * ELK: gerenciamento, análise, visualização e alertas de logs. * Opsgenie: gerenciamento de alertas, roteamento, políticas de escalonamento e integrações. * Terraform / Terraform Enterprise (avançado): tarefas de infraestrutura como código, criação de módulos e gerenciamento de ciclo de vida. * Bitbucket / GitHub (avançado): estratégias de branching, pull requests e revisões de código. * Python: scripts e automações, incluindo integrações com APIs. * JavaScript: scripts para automação e integrações com ferramentas. * Jenkins: pipelines CI/CD, fluxos de trabalho complexos e integrações. * AWS: compreensão dos principais serviços em nuvem e fundamentos de confiabilidade. * Coordenação com fornecedores + Capacidade de trabalhar com fornecedores externos em tópicos técnicos, incluindo triagem de problemas, suporte à implementação e acompanhamentos. + Conforto ao representar a perspectiva SRE em discussões com fornecedores. **Capacidades desejáveis** ----------------------------- * Capacidade de orientar engenheiros juniores e fornecer orientação técnica. * Fortes habilidades de comunicação e colaboração, incluindo trabalho com equipes internas e com fornecedores externos. **Capacidades complementares** ------------------------------- * Conhecimento de Node.js. * Familiaridade com tecnologias de contêineres (Docker, Kubernetes). * Familiaridade com Ansible. Atenção: somente serão consideradas candidaturas enviadas exclusivamente online. Somente os candidatos selecionados serão contatados. Observação apenas para candidatos da Polônia: Nesta posição, você ganhará no mínimo PLN 17.621 brutos por mês

Fonte da Informação:  indeed Ver publicação original
João Santos
Indeed · HR

Empresa

Indeed
João Santos
Indeed · HR

Vagas semelhantes

Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com