-
Notifications
You must be signed in to change notification settings - Fork 253
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Resultados do modelo preditivo em 2017 #33
Comments
Opa bom dia.. Estou iniciando meus estudos em ciencia de dados e achei esses script do cartola e comecei a estuda-lo... Mas esta dando erro ao rodar: df_players = predict_best_players(df_samples, reg, n_players=25) Ja rodei pra tentar arrumar e nada kkk |
Boa noite, @fir3f0x tentei rodar aqui agora o código do Jupyter notebook Análise dos Dados.ipynb e o código funcionou tranquilo. Analisando o erro que você mostrou, por algum motivo está faltando alguma coluna nos seus dados. Então, talvez possa ser alguma dessas coisas:
|
Estou rodando no windows 10.. Ja quando tento rodar o conda env create ja aparece Mas todos os pacotes estao instalados só nao nessas versões. Seria um problema? |
Acho que descobri minha falha... Rodei a sessão 3. Treinamento do modelo. Essa sessão não deve ser executada novamente? Segui na sequencia que vc falou e deu certo. Executei a sessão 3 e o erro volta.. Mudei apenas pra ele pegar os dados de 2016 e 2017 mas ai já da o erro. |
A sessão 3 não precisa ser executada se você não quer treinar um novo modelo. |
Arnaldo, Acredito que falta apenas um pequeno dado para que sua predição seja melhorada em pelo menos 20%. Mande um e-mail para mim. Vamos conversar sobre: [email protected] Abraço |
Põe na roda ai, @macsong :) Olhando os resultados, achei o modelo muito bom. No meu caso, o que trouxe alguma melhoria foi utilizar Random Forests como modelo preditivo ao invés de Redes Neurais. |
kkkkkkk
A variação é tão grande e a população tão baixa que os resultados são loucos.
Me passa o telefone que acho mais fácil para conversarmos.
Vai ser fácil aplicar e testar o resultado, mas tenho outras ideias loucas também.
Macson Guedes
From: Rafael Pierre <[email protected]>
Sent: quarta-feira, 18 de abril de 2018 20:04
To: henriquepgomide/caRtola <[email protected]>
Cc: Guedes, Macson <[email protected]>; Mention <[email protected]>
Subject: Re: [henriquepgomide/caRtola] Resultados do modelo preditivo em 2017 (#33)
Põe na roda ai, @macsong<https://github.com/macsong> :)
Olhando os resultados, achei o modelo muito bom.
No meu caso, o que trouxe alguma melhoria foi utilizar Random Forests como modelo preditivo ao invés de Redes Neurais.
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub<#33 (comment)>, or mute the thread<https://github.com/notifications/unsubscribe-auth/Aktx6QEou-iUPMBu41CPy8hGSN2HG0Vmks5tp8Z6gaJpZM4Q7DUx>.
…________________________________
Notice to recipient: This email is meant for only the intended recipient of the transmission, and may be a communication privileged by law, subject to export control restrictions or that otherwise contains proprietary information. If you receive this email by mistake, please notify us immediately by replying to this message and then destroy it and do not review, disclose, copy or distribute it. Thank you in advance for your cooperation.
|
Boa tarde. Gostaria de saber, como vocês fazem para realizar a atualização das rodadas? Como vocês fazem para obter os dados de cada rodada? Existe alguma API para obter todos esses dados das rodadas? |
Boa noite, @brunoeurico Nós utilizamos a API do Cartola mesmo. O lado ruim é que a API do Cartola só disponibiliza os dados rodada a rodada, ou seja, não há um histórico desses dados via API. Por conta disso, toda semana a gente pega esses dados e vai armazenando para criar o histórico. |
df_players = predict_best_players(df_samples, reg, n_players=25) Com erro? Solucao: |
Fala pessoal, Nas últimas semanas testei uns modelos pra fazer predições pro Cartola e criei um repositório pra quem quiser dar uma olhada e também tiver alguma sugestão (tdanf/cartola-predictions). Abraço! |
Não consegui achar o repositório! Curioso aqui para ver!
Abraços!
Em dom, 30 de set de 2018 às 19:17, Thiago Fleck <[email protected]>
escreveu:
… Fala pessoal,
Nas últimas semanas testei uns modelos pra fazer predições pro Cartola e
criei um repositório pra quem quiser dar uma olhada e também tiver alguma
sugestão (tdanf/cartola-predictions).
Vocês tão fazendo modelos para 2018?
Abraço!
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#33 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/ABxKo58_S2jiPP0qea9ZQOD7a1HAMC0gks5ugUMWgaJpZM4Q7DUx>
.
--
Henrique Gomide
Web: http://github.com/henriquepgomide
|
Opa! Segue o link https://github.com/tdanf/cartola-predictions |
Olá, como gero o arquivo dados_agregados ? |
Porque os dados de treino tem que ter dois jogos consecutivos de um jogador? a pontuação dele só está sendo prevista de acordo com a rodada passada? |
Oi, @mranjos |
@arnaldog12 entendi. Então, sou pouco familiarizado com o Python, estava transcrevendo os códigos para o R e ai acabei parando nessa etapa pois não tinha entendido muito bem. Estava pensando em criar uma regressão mais simples e interpretável do que uma rede neural, mas pode ser testada várias técnicas. Poderia ajudar sim na rede recorrente, mas ai seria no R, porque gastaria um tempinho pra aprender implementar no python. |
@arnaldog12 primeiro de tudo, show o LSTM, realmente é a melhor opção para regressão, estou fazendo alguns testes (ando complicado de tempo para testar) porem existem alguns parametros que estou mudando não na NN para nos dados. Tem uma gama de resultados / dados adicionais que são importantes:
|
Concordo com o @getzleo , acho que seria interessante montar um book de variáveis antes de ir pra técnica, adicionando ao que o @getzleo falou, talvez segmentar os times em grandes / médios / pequenos, jogos em casa e fora, como feature também, possa ser interessante, por exemplo, jogador X quando joga contra time grande fora de casa tende a ter em média um score menor ou maior. |
@mranjos casa vs fora é geralmente 65/35% não importa muito o time, e tem o empate na jogada ainda. Isto é fato. Não precisa segmentar em grande/medio/pequeno, apenas colocando os % de casa/empate/fora já é um score a mais. Tem outros fatores também , inclusive "clima/tempo". Pensa pessoal do sul jogando no calor infernal do nordeste ou vice-versa, até isto influencia. Por isto o score casa vs fora é importante alem do jogo em si |
Outra, alterei o Model para: model = Sequential() model.add(Dense(units=1, activation='linear')) model.compile(optimizer='adam', loss='mean_squared_error') model.fit(x, y, batch_size=64, epochs=300) Melhorou muito os "negativos" e os positivos pico de pontuação |
Também concordo com @mranjos e o @getzleo que devemos colocar mais algumas variáveis. Acho que as mais importantes agora são com qual time o jogador irá jogar na próxima rodada e se jogará fora ou em casa. O importante é que esses dados sejam da próxima rodada, já que a rede vai tentar prever baseado na próxima rodada. Alguém se disponibiliza a gerar esses dados, por favor? |
Esse seu modelo ficou muito legal, @getzleo Independente disso, os resultados ficaram legais. Você deu commit nessa rede? |
@arnaldog12 vamos lá. 1 - Jogos da rodada, ranking times Quanto ao Dense dentro do LSTM sim , em alguns modelos é normal e sobe muito a confiança do modelo. Mas deve ser sempre testado e validado. Ainda mais com ativadores diferentes, não dei commit não, mas fique a vontade para comitar se quiser |
Opa, @getzleo Os atributos dos itens 1 e 2 são interessantíssimos. O item 3, entretanto, eu acredito que não seja necessário. Uma rede neural facilmente faz essa associação. Por exemplo, se construíssimos uma rede que calculasse a pontuação dado os scouts + posição do jogador, com certeza o erro seria zero. Então, acho que não precisamos perder tempo com esse atributo. Os itens 4 e 5 eu me comprometo a fazer. Então, se você extrair os atributos dos itens 1 e 2, eu fico com os itens 4 e 5. Pode ser? |
@getzleo Esse ranking times seria a posição do time na tabela? Senão, acho que seria interessante essa informação também. |
Em vez do colocar o ranking, talvez valha a pena colocar o valor estimado
do elenco. A variável talvez nos dê mais informação.
Abraço,
…On Tue, May 21, 2019, 12:45 PM mranjos ***@***.***> wrote:
@getzleo <https://github.com/getzleo> Esse ranking times seria a posição
do time na tabela? Senão, acho que seria interessante essa informação
também.
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#33?email_source=notifications&email_token=AAOEVI464U3LTYACLIBUYTTPWQKLHA5CNFSM4EHMGUY2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGODV4KXMY#issuecomment-494447539>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/AAOEVI6UUQGHPC4LWOM5NOLPWQKLHANCNFSM4EHMGUYQ>
.
|
@mranjos @henriquepgomide quando digo raking é o resultado da RNN dos jogos. Um "Rating" e não ranking, para ser mais especifico. Valor do Elenco é relativo, tem jogador caro pontuando pouco. |
@arnaldog12 vou tentar validar e implementar os itens 1 e 2 o quanto antes |
ótimo, @getzleo 💯 |
My bad.
…On Tue, May 21, 2019, 2:15 PM Arnaldo Gualberto ***@***.***> wrote:
ótimo, @getzleo <https://github.com/getzleo> 💯
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub
<#33?email_source=notifications&email_token=AAOEVI2SCMYGR72M3LL2JSTPWQU3FA5CNFSM4EHMGUY2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGODV4SS5I#issuecomment-494479733>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/AAOEVI5YSY5SX5TIVD3TSYDPWQU3FANCNFSM4EHMGUYQ>
.
|
Vocês já estão com os dados limpos acrescentando 2018 e 2019? |
Fala Henrique tudo bem? Cara ano passado fiz contato com vc por não conseguir rodar o os scripts aqui disponibilizados por vc,... Data Science era uma grande caixa preta para mim,.. mas fui para a luta, e hoje volto aqui com disposição a tentar ajudar no projeto. Vou começar a interagir por aqui para ajudar no que precisar.... abraços! |
Que ótima notícia! Bem vindo ao navio pirata.
Parabéns pelo esforço e dedicação. Vejo três caminhos de contribuição.
# Resolver issues
Existem alguns issues que foram marcados. Se quiser atacá-los seria ótimo.
# Estender o código
Manda brasa e implemente uma ideia de análise.
# Estudos e tutoriais
Muitos cartoleiros acreditam que a terra é plana. Qualquer estudo dizendo
sobre o tamanho do impacto do mando de casa na pontuação de jogadores
jogará luz sobre o fantasy.
Pelos bons contatos que recebo, muita gente vem aqui aprender data science.
Existe melhor maneira de aprender do que ensinar?*
* Licença poética aqui porque existem várias maneiras melhores de aprender
do que ensinar.
Abraços,
Henrique.
…On Mon, May 27, 2019, 5:42 PM traluog ***@***.***> wrote:
Fala Henrique tudo bem? Cara ano passado fiz contato com vc por não
conseguir rodar o os scripts aqui disponibilizados por vc,... Data Science
era uma grande caixa preta para mim,.. mas fui para a luta, e hoje volto
aqui com disposição a tentar ajudar no projeto.
Com os dados disponibilizados por vc e outros web scraping que fiz pela
net,... consegui criar uma analise sobre os confrontos da rodada. Dê uma
olhada nesse link www.cartolytics.club.
Vou começar a interagir por aqui para ajudar no que precisar.... abraços!
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub
<#33?email_source=notifications&email_token=AAOEVI5MWNSHLMLL7WORHYLPXRBURA5CNFSM4EHMGUY2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGODWKPRIA#issuecomment-496302240>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/AAOEVIYFXF2HEQVFC6XZZVTPXRBURANCNFSM4EHMGUYQ>
.
|
Nessa planilha você pode conferir os jogadores que o nosso modelo preditivo acreditou que iam fazer boas pontuações e a pontuação real do jogador na respectiva rodada.
Esse ano utilizamos Redes Neurais como principal modelo preditivo, mas também chegamos a testar Random Forests e XGb. Ainda não fizemos nenhuma análise em cima das predições, mas pretendemos fazer em breve.
E aí? Você acha que nosso modelo mandou bem ou não?
Será que deveríamos ter utilizado outros modelos?
The text was updated successfully, but these errors were encountered: