lundi 30 mars 2020

Big data cluster : quelques tests

Une troisième vidéo sur les clusters big data SQL Server 2019.

J'ai voulu cette fois-ci faire quelques tests : performances de chargement et d'interrogation de données.

Les données sont :

  • Soit stockées dans le storage hdfs du cluster et interrogées directement via Polybase
  • Soit chargées dans le sql data pool distribué, et interrogées aussi via table externe
  • Soit dans une table SQL Server classique.

Je n'ai peut-être pas les volumes nécessaires pour faire du "vrai" big data, mais les performances à l'interrogation de donnéess sont de loin meilleures lorsque c'est une table SQL Server classique (pas de surcharge liée à Polybase...). On pouvait s'y attendre un peu, mais en tout cas, c'est instructif et cela permet de faire quelques constats...

jeudi 26 mars 2020

SSMS : copier sa liste de serveurs inscrits sur un autre ordinateur

Dans SQL Server Management Studio, la liste des serveurs inscrits est une fonctionnalité bien pratique. Ma propre liste comprend 260 serveurs : les miens et ceux de certains de mes clients. Maintenant que le travail à distance est une réalité quotidienne, j'ai besoin de transférer tout cela de mon ordinateur portable à mon ordinateur de bureau.

Il existe bien une fonction d'exportation et d'importation dans SSMS, le seul inconvénient est qu'il n'est pas possible de transférer les mots de passe (ceux pour les connexions SQL) : ils sont chiffrés avec la clé de l'utilisateur. En changeant d'ordinateur, l'importation d'un fichier embarquant les mots de passe chiffrés se passe mal (et d'importer un tel fichier peut même faire planter SSMS !).

Je n'ai pas vraiment envie de resaisir 200 mots de passe, et heureusement il existe une solution !

Lire la suite...

lundi 23 mars 2020

Geographie française en données spatiales

Par ces longues soirées (de confinement), c'est le moment de réviser sa géographie avec des requêtes SQL... Cette base de données recence les 36000 communes françaises, les départements et les régions. Je l'ai mise à jour à partir des données (publiques) de la poste et j'y ai ajouté les départements et les régions.

Petit jeu géographique :

  • Combien de communes s'appellent Pommiers en France, et combien y en a-t'il en Normandie ?
  • Quelle est la distance à vol d'oiseau entre Caen et Lisieux ?
  • Combien de départements (et combien de communes) comprend la région Normandie ?
  • Quelles est la région dessinée ici ?

 

Lire la suite...

vendredi 13 mars 2020

Restaurer sans le filestream

Une question qui m'a été posée : comment restaurer une base sans son filestream ?

Pour rappel, SQL Server sous Linux n'implémente pas le filestream ni le filetable. Que faire lorsque je dois y restaurer une base qui possède du stockage filestream ?

Lire la suite...

mercredi 11 mars 2020

Webcast : le déploiement d'un cluster Big Data SQL Server 2019

Une nouvelle vidéo sur la chaîne youtube Datafly : c'est un petit retour d'expérience sur le déploiement de mon cluster big data SQL Server 2019. S'appuyant sur Linux (ubuntu) et Kubernetes, on parcourt les principales étapes du déploiement de ma plate-forme de test et quelques commandes de troubleshooting. Pour plus d'informations sur l'architecture des clusters big data de SQL Server 2019, vous pouvez regarder une vidéo précédente de cette même chaîne : https://youtu.be/XvEc7OUbyCs

L'installation d'une plate-forme de ce type n'est pas une mince affaire, surtout on premise : importantes ressources matérielles (4 VM largement dotées en mémoire (56 Go), en CPU (8 cores) et en disque (200 Go)), installation de linux, installation de l'orchestrateur Kubernetes, personnalisation puis déploiement du cluster SQL Server 2019.

Et du temps : d'abord pour tout installer et configurer, avec les problèmes inhérents aux configurations sous linux, il faut quelques jours. Puis pour déployer : avec les dizaines de Go d'images à télécharger et ma bande passante "campagnarde", le déploiement prend quinzaine d'heures. Tout cela avec deux gros quadri-processeurs qui font office de chauffage électrique (en plus bruyant) dans le bureau.

Retour vers le futur aussi : se remettre à la ligne de commande, comme dans les années 80 (vieux souvenirs) !

lundi 9 mars 2020

Comment changer le classement d'une base de données

Question très souvent posée : comment peut on changer le classement (collation) d’une base de données ? Passer par exemple de case sensitive à case insensitive ? Vous verrez ici que l'opération est loin d'être simple !

Cet article vous propose aussi un script qui pourra vous y aider...

Lire la suite...

jeudi 27 février 2020

Analyser les "wait statistics"

Cet article décrit ce que sont les "wait statistics", comment ces informations peuvent vous aider à diagnostiquer des problèmes de performances, et pourquoi vous trouvez certaines requêtes avec un statut "SUSPENDED".

Lire la suite...

vendredi 21 février 2020

Retrouvez la version d'origine

Savez-vous que les fichiers de données ou de sauvegarde de SQL Server embarquent l'information sur la version d'origine qui a servi à les créer ?

Dans pas mal de cas, il peut être utile de savoir de quelle version provient un fichier de données ou de sauvegarde, voire connaître pour une base de données existante dans quelle version elle a été créée au départ.

Voici comment obtenir cette information...

Lire la suite...

samedi 15 février 2020

Changement d'hébergement

Mon fournisseur (gandi pour ne pas le nommer) a la mauvaise idée de retirer prochainement de son offre sa plate-forme de blog gratuite. Ce blog a donc été entièrement migré et reconstruit sur une nouvelle plate-forme. Possible que certaines images manquent ou que certains anciens articles ne s'affichent plus comme avant, n'hésitez pas à me le signaler...

vendredi 14 février 2020

Série en 5 épisodes : Haute Disponibilité

Une nouvelle série de vidéos a été publiée sur la chaîne youtube Datafly : 5 épisodes sur la haute disponibilité avec SQL Server. C'est l'occasion de vous présenter un petit panorama illustré :

  • Le premier épisode présente le log shipping
  • Le second, le database mirroring
  • Le troisième, les clusters FCI
  • Le quatrième, les groupes de disponibilité Always On
  • Le cinquième et dernier épisode fait une petite synthèse et répond à quelques questions posées.

- page 1 de 15