Pular para conteúdo

1. Introdução

A Ciência de Dados é uma área multidisciplinar que exige não apenas conhecimento estatístico e habilidades em programação, mas também domínio sobre um conjunto de ferramentas que otimizam o fluxo de trabalho. Este guia apresenta as principais ferramentas utilizadas por profissionais da área, organizadas por função e aplicabilidade no ciclo de vida dos projetos.

1.1. Principais Ferramentas

1.1.1. 🔧 Controle de Versão

  • Git: sistema de controle de versão distribuído, essencial para versionar código e colaborar em equipe. Combinado com plataformas como GitHub ou GitLab, permite o gerenciamento eficiente de repositórios e histórico de alterações.

1.1.2. 📦 Gerenciamento de Dependências

  • Poetry: ferramenta moderna para gerenciamento de pacotes e ambientes Python. Substitui o tradicional pip + virtualenv, oferecendo controle mais estruturado sobre bibliotecas e versões.

1.1.3. 🐳 Containerização e Ambientes Reprodutíveis

  • Docker: permite empacotar aplicações e suas dependências em contêineres isolados, garantindo portabilidade e reprodutibilidade dos experimentos e pipelines.
  • Docker
  • Docker env guide

1.1.4. 🧬 Estruturação de Projetos

  • Cookiecutter: utilitário para gerar automaticamente estruturas de projeto baseadas em templates personalizados. Ajuda a padronizar a organização de diretórios e arquivos.

1.1.5. 📊 Dashboards e Aplicações Interativas

  • Streamlit: biblioteca para criar interfaces web interativas com Python, ideal para visualizações, apresentação de modelos e construção de protótipos de maneira rápida.

1.1.6. 🖥️ Terminal e Linha de Comando

  • TerminalO uso do terminal é fundamental para operar ferramentas como Git, Poetry e Docker. Comandos de shell otimizam tarefas repetitivas e aumentam a produtividade do cientista de dados.

1.1.7. 📚 Documentação de Projetos

  • MkDocs: ferramenta para gerar sites estáticos a partir de arquivos Markdown. O tema Material for MkDocs é amplamente adotado por seu visual moderno e recursos avançados como busca embutida e navegação estruturada.

1.1.8. LaTeX

O LaTeX é uma linguagem de marcação amplamente utilizada para escrever equações matemáticas com alta qualidade tipográfica. Ele pode ser integrado tanto em Markdown quanto em Jupyter Notebooks com suporte ao MathJax.

1.1.9. 🧠 Outras Ferramentas Relevantes

  • Jupyter Notebooks: embora amplamente usados para prototipagem e exploração de dados, são ainda mais úteis quando integrados com ferramentas de versionamento e documentação.
  • Visual Studio Code (VSCode): editor leve e extensível, com suporte a Python, Git, terminal integrado, Jupyter, e plugins que complementam todo o ecossistema.

🧭 Este site está estruturado para explorar cada uma dessas ferramentas em detalhes, com exemplos práticos e guias de configuração passo a passo.