Newer
Older
1. Commencez par télécharger les données et les lire avec GraphStream. GraphStream sait lire ce format. Voir [`FileSourceEdge`](https://data.graphstream-project.org/api/gs-core/current/org/graphstream/stream/file/FileSourceEdge.html) et ce [tutoriel](http://graphstream-project.org/doc/Tutorials/Reading-files-using-FileSource/). Vous pouvez essayer de visualiser le graphe mais pour cette taille ça sera très lent et très peu parlant.
**DONE**
2. Prenez quelques mesures de base: nombre de nœuds et de liens, degré moyen, coefficient de clustering. Quel sera le coefficient de clustering pour un réseau aléatoire de la même taille et du même degré moyen ?
```java
//Affichage des données sur le réseau
System.out.println("Le nombre des noeuds du graphe "+g.getNodeCount());
System.out.println("Le nombre des liens du graphe "+g.getEdgeCount());
System.out.println("Le degré moyen est : "+averageDegree(g));
System.out.println("Le coefficient de clustering est : "+averageClusteringCoefficient(g));
```
3. Le réseau est-il connexe ? Un réseau aléatoire de la même taille et degré moyen sera-t-il connexe ? À partir de quel degré moyen un réseau aléatoire avec cette taille devient connexe ?
<p>
Pour un régime connecté : le degré < k > doit etre supérieur à ln(N) avec N le nombre de noeuds du graphe.
Dans notre cas : ln(N) = ln(317080) = 12.66 qui est supérieur au degré qui égale à 6,62
</p>
4. Calculez la distribution des degrés et tracez-la avec gnuplot (ou avec votre outil préféré) d'abord en échelle linéaire, ensuite en échelle log-log. Est-ce qu'on observe une ligne droite en log-log ? Que cela nous indique ? Tracez la distribution de Poisson avec la même moyenne pour comparaison. Utilisez la commande fit de gnuplot pour trouver les coefficients de la loi de puissance et tracez-la.
<p>
En traçant la distribution de degrés en échelle log-log on observe une ligne droite pendant plusieurs ordres de grandeur. Cela nous indique une loi de puissance :
Cela nous indique une loi de puisance de : pk=Ck−γ
On a On a γ=2.7±0.04\gamma = 2.7 \pm 0.04γ=2.7±0.04
</p>
5. Maintenant on va calculer la distance moyenne dans le réseau. Le calcul des plus courts chemins entre toutes les paires de nœuds prendra plusieurs heures pour cette taille de réseau. C'est pourquoi on va estimer la distance moyenne par échantillonnage en faisant un parcours en largeur à partir de 1000 sommets choisis au hasard. L'hypothèse des six degrés de séparation se confirme-t-elle ? Est-ce qu'il s'agit d'un réseau petit monde ? Quelle sera la distance moyenne dans un réseau aléatoire avec les mêmes caractéristiques ? Tracez également la distribution des distances. Formulez une hypothèse sur la loi de cette distribution.
<p>
Le code suivant permet de trouver l'estimation de la distance moyenne sur un échantillon de 1000 sommets
```java
double sommeDistances = 0;
int nbr=0;
//parcours en largeur
for(int i = 0 ; i < 1000 ; i++){
Node depart = randomNode(g);
BreadthFirstIterator it = new BreadthFirstIterator(depart);
while(it.hasNext()){
Node next = it.next();
sommeDistances += it.getDepthOf(next);
nbr++;
}
}
System.out.println("la distance moyenne est :"+(sommeDistances/nbr));
```
La valeur de la distance moyenne obtenue est : **6.760441774946385**
L'hypothèse des six degrés de séparation se confirme et la distance entre deux noeuds choisis au hasard est courte car,
la distance moyenne est égale à ln(N)/ln(k) = ln(317080)/ln(6.6220889) = **6.700611819**
Par déduction, le réseau s'agit bien d'un petit monde
Un réseau généré aléatoirerment avec les memes caracteristiques a un peu près la meme distance moyenne : **6.903640794874903**
**Distribution des distances :**

</p>
6. Utilisez les générateurs de GraphStream pour générer un réseau aléatoire et un réseau avec la méthode d'attachement préférentiel (Barabasi-Albert) qui ont la même taille et le même degré moyen. Refaites les mesures des questions précédentes pour ces deux réseaux. Les résultats expérimentaux correspondent-ils aux prédictions théoriques ? Comparez avec le réseau de collaboration. Que peut-on conclure ?
<p>
Les mesures sont faites sur deux graphes : un généré aléatoirement et l'autre avec la méthode d'attachement préférentiel (Barabasi-Albert)
.png)
Comme nous pouvons le remarquer sur l'image ci-dessus, le coefficient de clustering du grape Barabasi est différent de celui du graohe généré aléatoirement, qui est différent aussi des prédictions théoriques :
Le coefficient de clustering est petit, alors la probabilité que deux nœuds soient connectés sachant qu'ils ont un voisin en commun est plus petite.
</p>