




**Visão Geral da Empresa** -------------------- A Arcesium é uma empresa global de tecnologia financeira que resolve desafios complexos baseados em dados enfrentados por algumas das instituições financeiras mais sofisticadas do mundo. Inovamos constantemente em nossa plataforma e capacidades para enfrentar os desafios do futuro, antecipar os riscos que nossos clientes enfrentam e projetar soluções avançadas para ajudar nossos clientes a alcançarem resultados empresariais transformacionais. A tecnologia financeira é um setor de alto crescimento, pois mudanças e inovações continuam a interromper o status quo e provocar grandes transformações. A Arcesium está em um momento particularmente interessante em seu próprio crescimento, pois busca aproveitar sua posição consolidada no mercado e expandir suas operações na busca de novas oportunidades estratégicas de negócios. Valorizamos a curiosidade intelectual, a proatividade e a colaboração com colegas, e capacitamos você para contribuir de forma significativa desde o primeiro dia e acelerar seu desenvolvimento profissional. **Sobre a Função e a Equipe** Estamos procurando um Engenheiro de Confiabilidade do Site (SRE) sênior inteligente, criativo e altamente qualificado para se juntar à nossa equipe de Engenharia de Confiabilidade do Site da Plataforma (PSRE). Esta equipe desempenha um papel fundamental na garantia da estabilidade, confiabilidade e disponibilidade de aplicações de produção críticas na plataforma Arcesium. A **equipe PSRE** é responsável por: * Observabilidade, monitoramento, registro de logs e rastreamento para detectar e prevenir proativamente problemas. * Desenvolver ferramentas e infraestrutura que aumentem a estabilidade e resiliência do sistema. * Solucionar problemas em produção com foco profundo na resolução rápida de incidentes. * Gerenciar, declarar, controlar e recuperar incidentes em toda a plataforma, minimizando tempo de inatividade e impacto nos negócios. Como um SRE nesta equipe de grande impacto, você trabalhará sob prazos apertados em um ambiente de alta pressão, onde cada segundo conta na resolução de incidentes críticos de produção. Isso significa que você deve ser rápido na tomada de decisões, altamente analítico e proativo na prevenção e resolução de interrupções. **Suas Responsabilidades:** * **Gestão de Incidentes:** Atuar como contato principal e líder para incidentes e problemas críticos que afetem nossa plataforma durante o horário comercial de Nova York. Assumir a responsabilidade pelos incidentes, conduzir comunicações eficazes e facilitar a resolução rápida por meio da colaboração com as equipes de engenharia relevantes. * **Monitoramento e Análise Proativos:** Monitorar continuamente a saúde e o desempenho de nossas aplicações e infraestrutura. Analisar tendências, identificar riscos potenciais e implementar medidas proativas para prevenir incidentes e melhorar a confiabilidade geral do sistema. * **Solucionar Problemas e Depurar:** Diagnosticar problemas técnicos complexos em várias camadas da pilha (aplicação, infraestrutura, rede). Utilizar suas habilidades analíticas e conhecimentos técnicos para identificar causas raiz e implementar soluções eficazes. * **Colaboração e Comunicação:** Trabalhar em estreita colaboração com equipes de engenharia, desenvolvimento e operações para garantir uma colaboração perfeita durante a resposta a incidentes e em iniciativas proativas de confiabilidade. Comunicar-se efetivamente com partes interessadas em todos os níveis, fornecendo atualizações claras e concisas sobre incidentes e status do sistema. * **Automação e Otimização:** Identificar oportunidades para automatizar tarefas, melhorar a eficiência operacional e aumentar a resiliência dos nossos sistemas. Desenvolver ferramentas e scripts conforme necessário para simplificar processos e reduzir intervenções manuais. * **Melhoria Contínua:** Contribuir para o desenvolvimento contínuo e aprimoramento das práticas, ferramentas e processos de SRE. Compartilhar seus conhecimentos e expertise com a equipe para promover uma cultura de aprendizado e crescimento. **O que estamos procurando:** * Até 5 anos de experiência em uma função de **Engenharia de Confiabilidade do Site (SRE), DevOps ou Engenharia de Produção**, com sólida compreensão dos princípios e melhores práticas de SRE. * Experiência em gestão de incidentes, incluindo triagem, escalonamento e resolução de falhas de alta severidade. * Domínio em pelo menos uma linguagem de programação (Python ou Java) para automação e depuração. * Experiência prática com Kubernetes (K8s) para gerenciar e orquestrar aplicações em contêineres. * Experiência em nuvem (AWS preferencial) com conhecimento em serviços-chave como EC2, S3, Lambda e CloudWatch. * Excelentes habilidades de comunicação para explicar claramente desafios e soluções técnicas. * Fortes habilidades de solução de problemas e pensamento analítico, com experiência em diagnosticar questões complexas em produção. * Capacidade de manter a calma sob pressão, realizar múltiplas tarefas e priorizar efetivamente em ambientes dinâmicos. * Fluência em inglês (falado e escrito) é obrigatória. * É necessário ter o direito legal para trabalhar no país. **Habilidades Desejáveis:** * Experiência com Terraform ou CloudFormation para infraestrutura como código. * Experiência com ferramentas de monitoramento (por exemplo, Datadog, Prometheus, Grafana) * Familiaridade com arquiteturas de aplicações web e boas práticas. * Experiência com pipelines CI/CD e fluxos de trabalho DevOps. **Por que se juntar a nós?** Este não é um cargo SRE comum — **esta é uma função que impacta diretamente operações críticas para os negócios**. Se você **se destaca sob pressão, tem mentalidade voltada para solução de problemas e gosta de trabalhar em um ambiente de alto risco**, este é o lugar certo para você. **Pronto para fazer a diferença? Candidate-se agora!** *A Arcesium e suas filiais não discriminam em questões de emprego com base em raça, cor, religião, gênero, identidade de gênero, gravidez, origem nacional, idade, elegibilidade para serviço militar, condição de veterano, orientação sexual, estado civil, deficiência ou qualquer outra categoria protegida por lei. Observe que, para nós, isso vai além de uma simples exigência legal. Estamos genuinamente comprometidos com esses princípios, que formam uma parte importante de nossa cultura corporativa, e estamos ansiosos para receber candidaturas de indivíduos extraordinariamente qualificados com uma ampla variedade de origens e características pessoais.*


