Navegar
···
Entrar / Registrar

Engenheiro Sênior de Confiabilidade de Site – PSRE

Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
PV49+C7 Lisboa, 1000-001, Portugal
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: A Arcesium está buscando um Engenheiro Sênior de Confiabilidade de Site altamente qualificado e versátil para garantir a estabilidade, confiabilidade e disponibilidade de aplicações de produção críticas para a missão, em um ambiente de alto impacto e ritmo acelerado. Pontos de destaque: 1. Papel crítico para garantir a estabilidade, confiabilidade e disponibilidade de aplicações 2. Oportunidade de fazer a diferença em operações essenciais para os negócios 3. Desenvolver-se sob pressão com uma mentalidade voltada para a resolução de problemas **Visão Geral da Empresa** -------------------- A Arcesium é uma empresa global de tecnologia financeira que resolve desafios complexos orientados por dados enfrentados por algumas das instituições financeiras mais sofisticadas do mundo. Inovamos constantemente nossa plataforma e capacidades para enfrentar os desafios do amanhã, antecipar os riscos encontrados por nossos clientes e projetar soluções avançadas que ajudem nossos clientes a alcançar resultados transformadores nos negócios. A tecnologia financeira é um setor de alto crescimento, pois as mudanças e inovações continuam a perturbar o status quo e a impulsionar grandes transformações. A Arcesium encontra-se em um momento particularmente interessante em seu próprio crescimento, à medida que busca aproveitar sua posição consolidada no mercado e expandir suas operações na busca por novas oportunidades estratégicas de negócios. Valorizamos a curiosidade intelectual, a propriedade proativa e a colaboração com colegas, além de capacitá-lo para contribuir de forma significativa desde o primeiro dia e acelerar seu desenvolvimento profissional. **Sobre a Função e a Equipe** Estamos procurando um Engenheiro Sênior de Confiabilidade de Site (SRE) inteligente, versátil e altamente qualificado para integrar nossa equipe de Engenharia de Confiabilidade de Site da Plataforma (PSRE). Essa equipe desempenha um papel crítico ao garantir a estabilidade, confiabilidade e disponibilidade de aplicações de produção críticas para a missão na plataforma Arcesium. A **equipe PSRE** é responsável por: * Observabilidade, monitoramento, registro de logs e rastreamento para detectar e prevenir proativamente problemas. * Construção de ferramentas e infraestrutura que aprimorem a estabilidade e resiliência dos sistemas. * Solução de problemas em produção ativa com foco profundo na resolução rápida de incidentes. * Governança, declaração, gerenciamento e recuperação de incidentes em toda a plataforma, com o objetivo de minimizar tempo de inatividade e impacto nos negócios. Como SRE nessa equipe de alto impacto, você trabalhará sob prazos rigorosos em um ambiente de alta pressão, onde cada segundo conta na resolução de incidentes críticos de produção. Isso significa que você deve ser capaz de pensar rapidamente, ter forte capacidade analítica e agir de forma proativa para prevenir e resolver interrupções. **O que você fará:** * **Gestão de Incidentes:** Atuar como contato principal e líder para incidentes e questões críticas que afetem nossa plataforma durante o horário comercial de Nova York. Assumir a propriedade dos incidentes, conduzir comunicações eficazes e facilitar a resolução ágil colaborando com as equipes de engenharia relevantes. * **Monitoramento e Análise Proativos:** Monitorar continuamente a saúde e o desempenho de nossas aplicações e infraestrutura. Analisar tendências, identificar riscos potenciais e implementar proativamente medidas para prevenir incidentes e melhorar a confiabilidade geral do sistema. * **Solução de Problemas e Resolução de Problemas:** Diagnosticar problemas técnicos complexos em várias camadas da pilha (aplicação, infraestrutura, rede). Utilizar suas habilidades analíticas e conhecimento técnico para identificar causas-raiz e implementar soluções eficazes. * **Colaboração e Comunicação:** Trabalhar em estreita colaboração com equipes de engenharia, desenvolvimento e operações para garantir uma colaboração perfeita durante a resposta a incidentes e em iniciativas proativas de confiabilidade. Comunicar-se eficazmente com partes interessadas em todos os níveis, fornecendo atualizações claras e concisas sobre incidentes e o status do sistema. * **Automação e Otimização:** Identificar oportunidades para automatizar tarefas, melhorar a eficiência operacional e aprimorar a resiliência de nossos sistemas. Desenvolver ferramentas e scripts conforme necessário para simplificar processos e reduzir intervenções manuais. * **Melhoria Contínua:** Contribuir para o desenvolvimento contínuo e aprimoramento de nossas práticas, ferramentas e processos de SRE. Compartilhar seus conhecimentos e experiência com a equipe para fomentar uma cultura de aprendizado e crescimento. **O que buscamos:** * Até 5 anos de experiência em uma função de **Engenharia de Confiabilidade de Site (SRE), DevOps ou Engenharia de Produção**, com sólida compreensão dos princípios e melhores práticas de SRE. * Experiência em gestão de incidentes, incluindo triagem, escalonamento e resolução de interrupções de alta gravidade. * Domínio de pelo menos uma linguagem de programação (Python ou Java) para automação e depuração. * Experiência prática com Kubernetes (K8s) para gerenciar e orquestrar aplicações em contêineres. * Experiência em nuvem (AWS preferencialmente), com exposição a serviços-chave como EC2, S3, Lambda e CloudWatch. * Excelentes habilidades de comunicação para articular claramente desafios e soluções técnicas. * Fortes habilidades de solução de problemas e resolução de problemas, com experiência no diagnóstico de questões complexas em produção. * Capacidade de manter a calma sob pressão, executar múltiplas tarefas simultaneamente e priorizar eficazmente em ambientes dinâmicos. * Fluência em inglês (falado e escrito) é obrigatória. * É necessário ter o direito legal para trabalhar no país. **Habilidades Desejáveis:** * Experiência com Terraform ou CloudFormation para infraestrutura como código. * Experiência com ferramentas de monitoramento (ex.: Datadog, Prometheus, Grafana) * Familiaridade com arquiteturas de aplicações web e boas práticas. * Exposição a pipelines CI/CD e fluxos de trabalho DevOps. **Por que se juntar a nós?** Esta não é uma função típica de SRE — **esta é uma função que impacta diretamente operações essenciais para os negócios**. Se você **desenvolve-se sob pressão, possui uma mentalidade voltada para a resolução de problemas e gosta de trabalhar em um ambiente de alto risco**, este é o lugar certo para você. **Pronto para fazer a diferença? Candidate-se agora!** *A Arcesium e suas afiliadas não discriminam em questões de emprego com base em raça, cor, religião, gênero, identidade de gênero, gravidez, origem nacional, idade, elegibilidade para serviço militar, condição de veterano, orientação sexual, estado civil, deficiência ou qualquer outra categoria protegida por lei. Observe que, para nós, isso vai muito além de uma cláusula jurídica padrão. Estamos genuinamente comprometidos com esses princípios, que constituem uma parte importante de nossa cultura corporativa, e estamos ansiosos para receber candidaturas de indivíduos extraordinariamente bem qualificados, com uma ampla variedade de origens e características pessoais.*

Fonte da Informação:  indeed Ver publicação original
João Santos
Indeed · HR

Empresa

Indeed
João Santos
Indeed · HR

Vagas semelhantes

Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com