Fundo com imagem de código de programação

Espedito Ferreira Alves

Eu sou

Sobre Mim

Cientista de Dados com sólida formação matemática, especializado em transformar dados complexos em insights acionáveis e modelos preditivos de alta performance. A trajetória com dados teve início em 2021, ainda como estagiário, quando assumi a responsabilidade de melhorar a relação da equipe com o conjunto de dados disponível — papel que despertou o protagonismo na construção de confiabilidade e clareza analítica desde os primeiros passos da carreira. Experiência consolidada no desenvolvimento de arquiteturas escaláveis e na aplicação de modelos de Machine Learning — com ênfase em classificação, regressão e séries temporais — para resolver problemas de negócio de forma eficiente. Experiência no ecossistema Databricks e na construção de pipelines analíticos em SQL (Trino/Presto) e Python, com forte atuação em modelagem de dados para reportes estratégicos e geração de impacto real nos negócios.

Tech Skills

Python Python
Pandas Pandas
NumPy NumPy
Scikit-Learn Scikit-Learn
Plotly Plotly
Matplotlib
Seaborn
📐 Statsmodels
Jupyter Jupyter
PySpark PySpark
Presto SQL Presto SQL
📐 Estatística Aplicada
Power BI

Experiência Profissional

Cientista de Dados

Shopee | Junho de 2025 - Presente | São Paulo, Brasil

Atuo na área de Sales & Operations Planning (S&OP) da Shopee Express, com foco em Solutions Engineering aplicado a planejamento, forecasting e decisões estratégicas em escala nacional. Desenvolvo e mantenho modelos de forecasting baseados em Machine Learning (classificação e regressão) e modelagem estatística, com ênfase em séries temporais para capturar padrões de demanda e sazonalidade. Construo pipelines analíticos robustos utilizando Presto SQL, integrando dados de demanda, fulfillment, pickup stations, malha logística e projeções financeiras (FP&A), além de estruturar camadas analíticas que garantem consistência e rastreabilidade dos dados. Também sou responsável pela modelagem de dados em Google Sheets para a criação de reportes estratégicos e dashboards executivos, assegurando que as informações sejam apresentadas de forma clara, acessível e alinhada às necessidades de negócio. Essas soluções sustentam os números oficiais de forecasting da companhia, utilizados em decisões estratégicas de curto, médio e longo prazo.

Principais frentes de atuação:

  • Solutions Engineering aplicado a S&OP e Forecasting
  • Desenvolvimento e governança dos modelos oficiais de forecast (ML)
  • Construção de pipelines analíticos em SQL (Trino/Presto) e Python
  • Criação de dashboards executivos e indicadores estratégicos
  • Garantia de qualidade, consistência e rastreabilidade dos dados oficiais

Competências: Machine Learning • Forecasting • S&OP • Python • SQL (Trino/Presto)

Cientista de Dados

Bradesco | Nov de 2022 - Mai de 2025 | São Paulo, Brasil

Atuei como cientista de dados, focando no desenvolvimento de modelos para prevenção à lavagem de dinheiro e ao financiamento do terrorismo. É um campo desafiador que exige uma análise rigorosa de dados e estatísticas, além do uso de técnicas de machine learning para criar modelos preditivos eficazes. Minhas responsabilidades incluíam a execução de consultas e a integração de dados de múltiplas fontes para a modelagem necessária ao desenvolvimento dos modelos. Para tal, era imprescindível o uso de ferramentas de big data, como ambientes de data lake, PySpark, Python SQL e, ocasionalmente, SAS, para estruturar as informações de maneira eficiente.

Competências principais: Machine Learning • Big Data • PySpark • Python • SQL • SAS

Estagiário - Gestão de Riscos

Andrade Gutierrez | Março de 2021 - Outubro 2022 | São Paulo, Brasil

Dentre minhas atribuições, estava a análise de dados das matrizes de risco, a consolidação dos resultados e a elaboração de apresentações para a liderança. Percebendo a necessidade de um método mais eficiente para apresentar esses resultados, assumi a iniciativa de desenvolver dashboards no Power BI para o departamento de risco. Esse esforço visava não apenas a automação das apresentações, mas também a agilização dos processos. Além disso, projetei um processo de tratamento de dados aprimorado, garantindo uma integração harmoniosa com o Power BI. No desenvolvimento do sistema de gestão de riscos, atuei como uma ponte vital entre a equipe de TI e o setor de risco. Fui encarregado dos testes e da homologação de cada etapa do desenvolvimento, assegurando a aderência à metodologia de gestão de risco em todas as fases do processo.

Competências: Gestão de riscos • Gestão de riscos de portfólio • Microsoft Power BI • Microsoft Excel • Análise de dados estatísticos • Comunicação

Formação Acadêmica

Licenciatura em Matemática

Universidade de São Paulo (USP) | 2018 - 2026

Base sólida em Matemática, com ênfase em Matemática Computacional Aplicada, álgebra linear e probabilidade, essenciais para abstração e algoritmos estatísticos.

Meus Cursos

Formação Data Science Python

Alura | Certificado Concluído

  • Python para Data Science: Funções, estruturas e primeiros passos
  • Pandas & Numpy: Manipulação I/O, agrupamento, agregação e limpeza de dados
Spark

Formação Apache Spark com Python

Alura | Certificado Concluído

  • Apresentando a ferramenta e fundamentos
  • Trabalhando com Regressão
  • Processamento de Linguagem Natural (NLP)
  • Consrução de Sistema de Recomendação

Programação & Ferramentas Dev

Alura | Certificado Concluído

  • Git e Github: Controle e versionamento de código
  • Python: Boas práticas de código com PEP8
  • Python OO: Entendendo e avançando na Orientação a Objetos
  • Data Science: Análise visual e tratamento avançado de dados com Pandas

Fundamentos Analíticos & BI

DSA Academy & DIO.ME | Concluído

  • Power BI: Modelagem e Dashboards (Certificado DSA)
  • Python p/ Data Science: Fundamentos de análise de dados (DSA)
  • ETL com Python: Fundamentos de extração, transformação e carga (DIO.ME)

Meus Projetos