Skip to content

LCarlosA/avanti-bootcamp-cdd

Repository files navigation

<Império dos Dados>

Diamonds é um dataset que apresenta informações de atributos de mais de 54 mil diamantes, sendo elas características importantes na hora da compra ou da venda de diamantes importados. Preço, tamanho e quilates são informações cruciais para o mercado de diamante, por isso faremos um estudo desses dados para que possamos encontrar informações relevantes aos nossos clientes que desejam comprar o melhor diamante nesse luxuoso mercado que movimenta milhões de reais por ano.

.

Desenvolvedores


Objetivos:

Temos como objetivo nesse projeto entender quais os principais fatores que valorizam o preço do diamante, para podermos entregar um modelo com maior lucro máximo.

Sobre o projeto:

Esse foi o meu primeiro projeto oficial de estudo de análise de dados, realizado com auxílio de mentores. Então ele teve bastantes elementos de aprendizagem e pesquisa.

Dificuldades:

  • Organização visual e seus elementos

Soluções:

  • Pesquisa sobre desenvolvimento de visualização, como a leitura do livro Storytelling com dados

Aprendizado:

  • Storytelling com Dados
  • Funções vitais do matplotlib

Ferramentas:

  • Pandas
  • Matplotlib
  • Seaborn

Organização de diretórios

.
├── data/              # Diretório contendo todos os arquivos de dados
│   ├── external/      # Arquivos de dados de fontes externas
│   ├── interim/       # Arquivos de dados intermediários
│   ├── processed/     # Arquivos de dados processados
│   └── raw/           # Arquivos de dados originais, imutáveis
├── docs/              # Documentação gerada através da biblioteca mkdocs
├── models/            # Modelos treinados e serializados, predições ou resumos de modelos
├── notebooks/         # Diretório contendo todos os notebooks utilizados nos passos
├── references/        # Dicionários de dados, manuais e todo o material exploratório
├── src/               # Código fonte utilizado nesse projeto
│   ├── data/          # Classes e funções utilizadas para download e processamento de dados
│   ├── deployment/    # Classes e funções utilizadas para implantação do modelo
│   └── model/         # Classes e funções utilizadas para modelagem
├── app.py             # Arquivo com o código da aplicação do streamlit
├── Procfile           # Arquivo de configuração do heroku
├── pyproject.toml     # Arquivo de dependências para reprodução do projeto
├── poetry.lock        # Arquivo com sub-dependências do projeto principal
├── README.md          # Informações gerais do projeto
└── tasks.py           # Arquivo com funções para criação de tarefas utilizadas pelo invoke

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published