




Resumo: Procuramos um Engenheiro de Dados para projetar e manter pipelines de dados escaláveis, capacitando as equipes de IA e PLN da maior empresa de construção civil de Portugal. Principais destaques: 1. Construa a infraestrutura de dados para uma das maiores empresas de construção civil de Portugal. 2. Trabalhe diretamente na interseção entre engenharia de dados, inteligência artificial e processamento de linguagem natural (PLN). 3. Ambiente colaborativo e voltado para o futuro, focado em inovação. **Sobre a dstgroup** A dstgroup é uma das **maiores empresas de construção civil de Portugal**, atuando na convergência entre construção, engenharia e transformação digital. Com uma força de trabalho de mais de 3.000 colaboradores que geram diariamente grandes volumes de dados, nossa missão é construir bases de dados robustas que capacitem avançadas **equipes de IA e PLN**. Estamos procurando um **Engenheiro de Dados** para projetar e manter pipelines de dados escaláveis e de alta qualidade, tornando os dados acessíveis, estruturados e prontos para treinamento e avaliação de modelos. Seu trabalho permitirá diretamente que nossa equipe de IA/PLN se concentre na inovação, em vez da preparação de dados. **O que você fará** * Projetar, desenvolver e manter **pipelines ETL/CRISP\-DM** para processar diversos fluxos de dados em conjuntos estruturados e confiáveis. * Criar e otimizar **soluções baseadas em SQL**, com foco no ecossistema **PostgreSQL**, incluindo: * **pgvector**, para armazenamento e recuperação de embeddings, * **PostGIS**, para análise geoespacial, * **TimescaleDB**, para dados de séries temporais. * Implementar e gerenciar **APIs REST** para expor produtos de dados aos consumidores downstream. * Garantir qualidade, governança e reprodutibilidade dos dados, com especial atenção às **coleções textuais/dados de PLN**. * Desenvolver e manter **soluções contêinerizadas com Docker**, assegurando reprodutibilidade e escalabilidade. * Utilizar **Git e pipelines GitLab CI/CD** para automatizar testes, integração e implantação de fluxos de trabalho de dados. * Colaborar com as **equipes de IA/PLN** para compreender seus requisitos de dados e entregar conjuntos de dados otimizados para treinamento, avaliação e implantação de modelos. * Integrar ferramentas de código aberto com **serviços em nuvem Azure**, para armazenamento, orquestração e monitoramento. **O que buscamos** * 2 ou mais anos de experiência profissional como **Engenheiro de Dados** ou em cargo similar. * Excelente domínio de **SQL** e bancos de dados relacionais (especialmente PostgreSQL). * Experiência prática com **pgvector, PostGIS ou TimescaleDB**. * Experiência no projeto de APIs REST. * Fortes habilidades em programação **Python**, preferencialmente com **PySpark**. * Domínio de **Docker**, tanto em ambientes de desenvolvimento quanto de produção. * Experiência com **Git** e **GitLab CI/CD**. * Familiaridade com **Airflow** e **serviços em nuvem Azure**. * Experiência prévia em colaboração com **equipes de IA/ML**, especialmente na preparação de conjuntos de dados de PLN. * Boa capacidade de comunicação em inglês e aptidão para trabalhar em equipes multifuncionais. **Desejável (não obrigatório):** * Doutorado em Ciência da Computação, Inteligência Artificial ou área correlata. * Experiência tanto no meio acadêmico quanto no setor privado. * Histórico sólido de pesquisa científica (em qualquer área), com trabalhos em recuperação de informação, representação e raciocínio do conhecimento, extração estruturada de conhecimento ou análise de dados em larga escala. * Disposição para orientar membros mais jovens e coorientar teses de mestrado em colaboração com as universidades do Minho e do Porto. **O que oferecemos** * A oportunidade de moldar a **infraestrutura de dados** para uma das maiores empresas de construção civil de Portugal. * Trabalhar diretamente na interseção entre **engenharia de dados, IA e PLN**, com impacto comercial imediato. * Modelo híbrido de trabalho com flexibilidade. * Remuneração competitiva e pacote de benefícios atrativo. * Um ambiente colaborativo e voltado para o futuro, focado em inovação e tomada de decisões baseada em dados. Envie seu currículo para: \ ou inscreva-se no seguinte formulário: \ Você pode encontrar o anúncio original publicado em: https://www.itjobs.pt/oferta/506443/data\-engineer


