Café OSUG-DC 2017-10-05
Salle Taillefer OSUG-D 10H
Présents :
- Charleen
- Raphael
- Véronique
- Armel
- Gregory
- Françoise
- Catherine
- Guillaume
- Eric
Points généraux / tour de table
- Le VSAN EST disponible maintenant (msg. Francoise): migrer certaines VMs ?
- Pierre C fait les premiers tests de policies sur VMWare
- quelques difficultés avec les gros volumes pour l'équilibrage (operation de rééquilibrage en cours de 15min à 24H )
- [X] Reconfigurer les listes de diffusions imbriquées (osug-si inclue osug-dc, osug-action inclue osug-si)
Relance de tickets (revue rapide)
- Guillaume
N’hésitez pas à regarder vos tickets. Si vous n'êtes pas concerné par son traitement, affectez le à un autre collègue qui le mettra dans sa pile ou fera de même si ce n'est pas le bon interlocuteur.
N’hésitez pas à fermer les actions résolues ou demandez clairement au demandeur de vérifier et fermer le ticket.
Besoins/demandes/questions sujets collectifs identifiés pour le cours terme
Question des Sauvegardes:
- revoir la solution pour les machines resif ( la machine qui hebergait les données n'est plus garantie )
- Solutions actuelles : VIM(UGA) et VDP(OSUG)
- manque la restauration par fichier côté VDP et procédure sur export total d'un VM temporaire
- restauration possible VIMbackuop par fichier ou sur VM temporaire (necessite)
- cf doc wiki :
- solution rdiffbackup
- [] Compléter le receuil des besoins (tous)
- [] Puis ouvrir un ticket de demande générale
Zabbix:
https://wiki.osug.fr/wikis/osug-dc/doku.php?id=systeme:zabbix:centos#tests_serveur_pre-prod
Questions (Laurent B.):
- Zabbix étant critique, il faudrait que cette VM soit en haute priorité / disponibilité ou alors installé sur une machine dédiée ou en dehors de la plate-forme VMWare = chicken-egg problem !
- → haute dispo ok, reste encore la question de passer sur un hebergement winter (HA incluse)
- Comment superviser que le service zabbix fonctionne bien ? (monit ou un autre moyen), sinon redémarrage préventif tous les N jours
- → redémarrage non souhaité , penser à une supervision par la DSI également
- verifier config monit et relancer le service
- Performances:
- IO network / disk: utiliser le VSAN pour des performances maximales mais backup sur NAS ou SUMMER
- → géré si hebergement WINTER, mais à venir côté VMWareOSUG
- Config / Tuning postgres à faire ensemble
- → ok
- Backup à chaud et à froid (service arrété ou cluster postgres ?)
- → pas encore d'actualité, mais reprendre pour consolider le service bdd OSUG
- 1 seule VM (zabbix + postgres) vs 2 VMs (zabbix et postgres séparés): je préfère cloisonner pour éviter tout problème de performance (tuning spécifique) / indisponibilité du serveur postgres partagé; mais il faudra bien gérer les backups de la BDD avec le serveur d'archivage postgres partagé
- → les perf postgres n'étant pas immense, le serveur postgresql partagé actuel devrait faire l'affaire. confirmation avec les tests à venir.
Remarque:
- dans tous les cas l'installation étant en grande partie automatisée, il n'y aura pas de temps perdu à abandonner une machine pour reprendre ce travail sur une autre plateforme (WINTER).
Etat courant:
- Install en cours du zabbix sur VM centOS (rafael et gregory)
- [X] OS
- [X] install web serveur
- [] réglage serveur zabix
- Connecté sur la bdd postgresql serveur BDD RESIF
- Mise à jour du cluster postgres à plus long terme (armel)
Prochaines etapes:
- [] Passer le serveur en construction zabbix sur le VSAN
- [] Restaurer le dump de la prod actuelle
- [] Tester
En parallèle et pour pouvoir lancer des bench de bases (sans perturber la prod)
- [] Monter une VM de test pour le serveur postgresql sur le VSAN
Install service PHP:
- resif MArdi 17 10h (Raphael et Catherine)
Par la suite / plus tard:
- Vérifier que toutes les VM (VMWare OSUG) sont supervisées à minima sur Zabbix
ACL
- nettoyage en cours sur les regles du vlan OSUGD-CLIENT (avec prise en compte des accès VMWARE)
- reprendre la page initiée par Francoise pour
Serveur de log (syslog)
Raphael finalise l'installation et complète la documentation:
- installation/configuration du serveur
- notice d'utilisation par les clients
Points à ne pas oublier:
- Réglage DATE/TIME + TZ (UTC) sur tous les machines
- ACL
- Besoin d'un service elastic-search + kibana pour exploiter ces logs ?
Geo Cataloguage
- Remettre en route le service de geo-cataloguage (Eric / Véronique)
- remettre en route osug-geonetwork (Armel/Eric) en version mutualisé
- Eric passe voir Magali pour reprendre contact avec
- Réagréger l'existant.
A venir
A fixer dans les semaines qui arrivent:
- Charleen devrait pouvoir faire une présentation sur sa mission courant octobre et Rima avant la fin de l'annéee. ( 10-20' de présentation puis échanges/questions par ex. )
- Mise à jour du site osug-dc (jean-charles)
- Armel présentera l’état du cluster Postgres et sa mise à jour: mi octobre
- Veronique va revenir sur le suivi de la machine GlacioClim
- si possible sur le VSAN , besoin emission smtp
- Comment mettre en ligne un serveur postgres HA avec plusieurs versions
- actuellement utilisé par radardb
- prochainement zabbix
- probablement Ghosst/Sshade et certainement d'autres encore
- à migrer sur le VSAN
- [] initier une page de best practices sur les reglages serveurs pour nos services
Prochaines échéances/dates à retenir/absences
Manifestations générales
- 1-5 octobre: JavaOne 2017 (San Fransisco), Laurent présente un talk sur son Marlin renderer (JDK-9): slides (en cours): https://github.com/bourgesl/bourgesl.github.io/raw/master/javaone2017/slides/javaone-marlin-talk.pdf
- 16-17 octobre : journée SUCCES dans les locaux de GRICAD à Grenoble. (Scientifiques Utilisateurs de Calcul intensif, Cloud Et de Stockage )
- 14-17 novembre : JRES2017 https://www.jres.org/programme
- 22 au 24 novembre : Agile Grenoble 2017
- jeudi 5 octobre 14h : Conf Roberto di Cosmo
- Mercredi 22 au 24 novembre : Agile Grenoble: Eric maldonado ?
- 5-7 Décembre: Séminaire à Fréjus sur les données geographiques
- Formation Postgres en décembre (gregory, catherine, jonathan schaeffer) + Armel, autres ? Fabien Engels (EOST, RESIF)
Calendrier Projets
- RESIF
- préparation des journées RESIF
- JMMC
- Expiration des certificats du serveur principal d'applications (et signature de code) du JMMC en novembre → Deadline pour la migration d'infrastructure: en cours (raphael et guillaume)
- SSHADE
- mettre en exploitation le service à la fin de l'année (décalé de aout)
- pré-accès pour fin septembre
- question de passer à de debian 8 à 9
- prévoir une VM plus grosse : traité, faire un ticket pour reinstaller le service (debian 9, FS plus gros)
Disponibilités personnelles
- Laurent
- participation à la conf JavaOne du 30 au 7 octobre
- RESIF
- absents du 9 au 13 octobre
- Gregory
- absent du 25 au 29 octobre
- Guillaume
- 22 au 29 octobre : conf Adass et Interop http://www.adass.cl
- 14 au 19 Novembre : mission CHARA Los Angeles