




Resumo: Junte-se à dstgroup como Engenheiro de Dados para projetar e manter pipelines de dados escaláveis e de alta qualidade, capacitando as equipes de IA e PLN com dados estruturados e acessíveis. Pontos principais: 1. Estruturar a infraestrutura de dados de uma das maiores empresas de construção de Portugal. 2. Trabalhar diretamente na interseção entre engenharia de dados, IA e PLN. 3. Colaborar em um ambiente voltado para o futuro, com foco em inovação. **Sobre a dstgroup** A dstgroup, uma das **maiores empresas de construção de Portugal**, atua na interseção entre construção civil, engenharia e transformação digital. Com uma força de trabalho de mais de 3.000 colaboradores que geram diariamente grandes volumes de dados, nossa missão é construir bases de dados robustas que capacitem equipes avançadas de **IA e PLN**. Buscamos um **Engenheiro de Dados** para projetar e manter pipelines de dados escaláveis e de alta qualidade, tornando os dados acessíveis, estruturados e prontos para treinamento e avaliação de modelos. Seu trabalho permitirá que nossa equipe de IA/PLN se concentre na inovação, em vez da preparação dos dados. **Suas responsabilidades** * Projetar, desenvolver e manter **pipelines ETL/CRISP\-DM** para processar diversos fluxos de dados em conjuntos de dados estruturados e confiáveis. * Construir e otimizar **soluções baseadas em SQL**, com foco no ecossistema **PostgreSQL**, incluindo: * **pgvector**, para armazenamento e recuperação de embeddings, * **PostGIS**, para análise geoespacial, * **TimescaleDB**, para dados de séries temporais. * Implementar e gerenciar **APIs REST** para expor produtos de dados aos consumidores downstream. * Garantir qualidade, governança e reprodutibilidade dos dados, com ênfase especial em **coleções de dados textuais/PLN**. * Desenvolver e manter **soluções contêinerizadas com Docker**, assegurando reprodutibilidade e escalabilidade. * Utilizar **Git e pipelines GitLab CI/CD** para automatizar testes, integração e implantação de fluxos de trabalho de dados. * Colaborar com equipes de **IA/PLN** para compreender suas necessidades de dados e entregar conjuntos de dados otimizados para treinamento, avaliação e implantação de modelos. * Integrar ferramentas de código aberto com **serviços em nuvem da Azure**, para armazenamento, orquestração e monitoramento. **O que buscamos** * 2 ou mais anos de experiência profissional como **Engenheiro de Dados** ou em cargo similar. * Domínio sólido de **SQL** e bancos de dados relacionais (especialmente PostgreSQL). * Experiência prática com **pgvector, PostGIS ou TimescaleDB**. * Experiência no projeto de APIs REST. * Excelentes habilidades de programação em **Python**, preferencialmente com **PySpark**. * Domínio de **Docker** para ambientes de desenvolvimento e produção. * Experiência com **Git** e **GitLab CI/CD**. * Familiaridade com **Airflow** e **serviços em nuvem da Azure**. * Experiência prévia em colaboração com equipes de **IA/ML**, especialmente na preparação de conjuntos de dados de PLN. * Boa capacidade de comunicação em inglês e aptidão para trabalhar em equipes multifuncionais. **Desejável (não obrigatório):** * Doutorado em Ciência da Computação, Inteligência Artificial ou área correlata. * Experiência tanto no meio acadêmico quanto no industrial. * Histórico consolidado de pesquisa científica (em qualquer área), com trabalhos em recuperação de informação, representação e raciocínio do conhecimento, extração de conhecimento estruturado ou análise de dados em larga escala. * Disposição para orientar membros mais jovens e coorientar teses de mestrado em colaboração com as universidades do Minho e do Porto. **O que oferecemos** * A oportunidade de estruturar a **infraestrutura de dados** de uma das maiores empresas de construção de Portugal. * Trabalhar diretamente na interseção entre **engenharia de dados, IA e PLN**, com impacto comercial imediato. * Modelo de trabalho híbrido com flexibilidade. * Pacote salarial e benefícios competitivos. * Um ambiente colaborativo e voltado para o futuro, focado em inovação e tomada de decisões orientada por dados. Envie seu currículo para: \ ou envie-o pelo seguinte formulário: \ Você pode encontrar o anúncio original publicado em: https://www.itjobs.pt/oferta/506443/data\-engineer


