Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gather relevancy information about documents by harvesting the Matomo API to improve search #9

Open
fako opened this issue Feb 14, 2023 · 0 comments

Comments

@fako
Copy link
Contributor

fako commented Feb 14, 2023

Idee is om regelmatig de Matomo statistieken op te halen waarmee bijgehouden wordt welke url's gebruikers bezoeken en of ze daadwerkelijk een materiaal downloaden.

Op die manier zouden we een link moeten kunnen leggen tussen een query en of een materiaal relevant gevonden genoeg werd om te downloaden. We willen deze data gaan opslaan op zo'n manier dat we de zoekmachine ermee kunnen gaan verbeteren.

Create a command that will store QueryRankings based on Matomo input. Mark these rankings as automated

Tweetal vragen komen op bij het uitwerken van de automatische tests @woutersurf

  1. Wat doen we als een Document van taal veranderd? Momenteel veranderd een QueryRanking dan niet mee, maar dat zal problemen geven bij het evalueren
  2. Hoe moet de code een update detecteren versus een nieuwe QueryRanking? Gaan we sessies opslaan als "users"? Dat klinkt hacky.

Oplossing voor beide problemen is als we query rankings altijd vanaf scratch opbouwen. Dus een recreate i.p.v create or update. Mogelijk minder bruikbaar op lange termijn.

Daarnaast is het idee van dit ticket om ook echt de data uit Matomo te gaan gebruiken om de kwaliteit van de zoekresultaten te verbeteren. Het idee is dat we het pad

gebruiker zoekt met query --> gebruiker gaat naar materiaal --> gebruiker download materiaal

gaan gebruiken om een bijv nDCG analyses te maken: https://www.elastic.co/guide/en/elasticsearch/reference/current/search-rank-eval.html

@fako fako changed the title Gather relevancy information about documents by harvesting the Matomo API Gather relevancy information about documents by harvesting the Matomo API to improve search Feb 1, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant