1. Introdução¶
A Ciência de Dados é uma área multidisciplinar que exige não apenas conhecimento estatístico e habilidades em programação, mas também domínio sobre um conjunto de ferramentas que otimizam o fluxo de trabalho. Este guia apresenta as principais ferramentas utilizadas por profissionais da área, organizadas por função e aplicabilidade no ciclo de vida dos projetos.
1.1. Principais Ferramentas¶
1.1.1. 🔧 Controle de Versão¶
- Git: sistema de controle de versão distribuído, essencial para versionar código e colaborar em equipe. Combinado com plataformas como GitHub ou GitLab, permite o gerenciamento eficiente de repositórios e histórico de alterações.
1.1.2. 📦 Gerenciamento de Dependências¶
- Poetry: ferramenta moderna para gerenciamento de pacotes e ambientes Python. Substitui o tradicional
pip
+virtualenv
, oferecendo controle mais estruturado sobre bibliotecas e versões.
1.1.3. 🐳 Containerização e Ambientes Reprodutíveis¶
- Docker: permite empacotar aplicações e suas dependências em contêineres isolados, garantindo portabilidade e reprodutibilidade dos experimentos e pipelines.
- Docker
- Docker env guide
1.1.4. 🧬 Estruturação de Projetos¶
- Cookiecutter: utilitário para gerar automaticamente estruturas de projeto baseadas em templates personalizados. Ajuda a padronizar a organização de diretórios e arquivos.
1.1.5. 📊 Dashboards e Aplicações Interativas¶
- Streamlit: biblioteca para criar interfaces web interativas com Python, ideal para visualizações, apresentação de modelos e construção de protótipos de maneira rápida.
1.1.6. 🖥️ Terminal e Linha de Comando¶
- TerminalO uso do terminal é fundamental para operar ferramentas como Git, Poetry e Docker. Comandos de shell otimizam tarefas repetitivas e aumentam a produtividade do cientista de dados.
1.1.7. 📚 Documentação de Projetos¶
- MkDocs: ferramenta para gerar sites estáticos a partir de arquivos Markdown. O tema Material for MkDocs é amplamente adotado por seu visual moderno e recursos avançados como busca embutida e navegação estruturada.
1.1.8. LaTeX¶
O LaTeX é uma linguagem de marcação amplamente utilizada para escrever equações matemáticas com alta qualidade tipográfica. Ele pode ser integrado tanto em Markdown quanto em Jupyter Notebooks com suporte ao MathJax.
1.1.9. 🧠 Outras Ferramentas Relevantes¶
- Jupyter Notebooks: embora amplamente usados para prototipagem e exploração de dados, são ainda mais úteis quando integrados com ferramentas de versionamento e documentação.
- Visual Studio Code (VSCode): editor leve e extensível, com suporte a Python, Git, terminal integrado, Jupyter, e plugins que complementam todo o ecossistema.
🧭 Este site está estruturado para explorar cada uma dessas ferramentas em detalhes, com exemplos práticos e guias de configuração passo a passo.