Tâches (Todo)
GetD3ed
- [x] séparer database et pattern (choix exclusif)
- [x] expliciter les temps, un trait par temps
- [x] afficher les pattern dans une boite de selection et non pas linéairement dans une liste
- [ ] revoir les affichages :
- [x] enlever scrolls pour legende et svg
- [x] objets/transactions dans la légende
- [x] tester et debuguer lorsqu’il a beaucoup de liens par noeuds
- [x] améliorer coloration patterns
- [ ] améliorer coloration clusters
- [ ] redimensionnement :
- [ ] dimension des clusters en fonction du nombre de clusters par temps
- [x] la hauteur de la representation doit être fixe
- [x] la largeur de la representation doit dépendre du nombre de temps de nos données Json
- [x] Regler pb avec x quand il y a trop de noeuds (au moins 10)
- [ ] propager les décochages
- [x] lors du survol, mettre en valeur arêtes associés
- [x] faire une toolbox pour les transactions d’un pattern (comme survol sur le graphe)
jGetMove
- [x] revoir le fonctionnement de generateClusters
- [x] suppression de
database, remplacé par matrix
- [ ] mettre en place les blocs
- [ ] faire un jeu de test
- [ ] faire le makefile
- [ ] extraire les temps de base
Notions abordés
jGetMove
- blocs
- les fichiers de données sont chargés entierement, c’est lors de l’iteration sur le bloc (
generateClusters) qu’est généré le prochain blocs (sur un autre thread). Pour l’instant, celui-ci sera généré en même temps.
Todo
jGetMove
- [ ] faire les blocs
- [ ] revoir le fonctionnement de generateClusters
GetD3ed
- [ ] revoir les affichages
- [ ] répartir uniformement les clusters dans le temps
- [x] séparer database et pattern (choix exclusif)
- [x] afficher les pattern dans une boite de selection et non pas linéairement dans une liste
Notions abordées
Javascript
Le problème est d’homogèneiser les clusters. Si un temps contient beaucoup de clusters, un cluster de même taille dans ce temps là sera plus petit. Par conséquent, il faut qu’ils restent à l’échelle.
Python
Le but est de mettre en forme les données afin de pouvoir les envoyer à dbscan. Le problème est que les données sont dispersées dans le temps. Par conséquent, afin que dbscan fonctionne correctement, il faut rassembler les transactions dans des ensemble de temps afin que dbscan puisse détecter les similarités.
Il faut donc pré-parser les données suivant un intervalle de temps.
jGetMove
- lcm
- fonctionne par règles d’associations
generateClusters fait plusieurs taches (prépare les levels2 et fait les itemsets)
Todo
- [ ] clusters qui n’existent pas ?
- [ ] doc en anglais
- [ ] convergent-divergent
- [ ] test unitaires
- [ ] optimiser le code
A voir après
- [ ] utiliser dbscan pour générer les données
- [ ] mise en place du workflow à partir de movebank
A consulter
- [ ] movebank data repository
- [ ] explications des algos lcm : http://fimi.ua.ac.be/src/
- [ ] sources implementations lcm : http://ceur-ws.org/Vol-90/uno.pdf
- [ ] leaflet.js
Notions abordées
Fonctionnement de GetMove
generateClusters -> remappe les données en entrée en matrice qui peut être exploitée par generatePattern
- génère par rapport aux blocs les matrices des fichiers en entrée
- obtenir les itemsets
- création d’une matrice pour lcm