Sean Deuby

Active Directory est une application très robuste, comme il se doit pour un élément aussi fondamental de l'infrastructure informatique d'une entreprise. Mais l'architecture qui la rend robuste la rend également difficile à comprendre. Ce manque de compréhension conduit souvent à des hypothèses dans votre stratégie de récupération qui peuvent laisser votre AD cassé sans moyen de revenir à la normale.

Lorsque l'équipe d'ingénierie et d'exploitation AD élabore son plan de reprise, la tendance naturelle est de penser d'abord à la reprise des contrôleurs de domaine (DC). Il s'agit d'une bonne première étape, qui s'explique par deux raisons très pratiques. Tout d'abord, les DC ont toujours été les composants AD qui tombent le plus souvent en panne. Deuxièmement, la récupération et la reconstruction des serveurs est l'une des plus anciennes tâches opérationnelles dans le livre des opérations, et il est donc naturel de l'appliquer à cette situation.

Mais dans le cas d'Active Directory, l'équipe ne se préoccupe souvent pas de l'autre type de sinistre auquel Active Directory peut être confronté : la corruption logique des données AD.

La toile de la réplication

La complexité du modèle de données logique d'Active Directory rend en partie difficile sa compréhension et son dépannage opérationnel. J'ai toujours considéré Active Directory à travers ce que j'appelle plusieurs paires de lunettes. La première et la plus évidente est le réseau de DC physiques et leur santé. Nous avons tendance à penser aux DCs d'une forêt parce qu'ils sont les actifs tangibles d'Active Directory. Viennent ensuite mes lunettes sur les sites. Avec elles, je vois la topologie des sites du réseau de l'entreprise et la façon dont les données sont constamment répliquées entre les DC : les sites de bonne connectivité (qui peuvent ou non contenir un DC), les liens de site pour connecter les sites de la façon la plus adaptée aux besoins des utilisateurs et des applications qui utilisent les sites AD, et le réglage fin de ces liens de site avec le coût des liens et la priorité DNS pour favoriser certains DCs par rapport à d'autres.

Mais la réalité est plus compliquée qu'un diagramme d'architecture de site. Si l'on examine de près la réplication avec un outil tel que ADREPLSTATUS ou Repadmin, la véritable complexité d'Active Directory se révèle. Chaque DC héberge plusieurs partitions d'annuaire contenant des données importantes, et différentes conceptions de forêts influencent les partitions hébergées par un DC. Chacune de ces partitions est connectée à plusieurs autres DC ailleurs dans le domaine ou la forêt. Je vois cela comme un écheveau de centaines de fils multicolores reliant les chevilles d'un tableau. Certaines couleurs de fil ne vont qu'à quelques chevilles, tandis que d'autres couleurs vont à toutes les chevilles du tableau. C'est un miracle que cela fonctionne, et encore plus que cela fonctionne si bien.

Mais ce mécanisme fonctionne aussi bien pour les mauvaises données que pour les bonnes. En cas de corruption logique des données, les données corrompues seront répliquées par tous les DC du domaine ou de la forêt. Dans les cas où la corruption logique est grave (comme la désactivation du compte du centre de données dans AD via la console standard Utilisateurs et ordinateurs), une reprise après sinistre d'AD doit être effectuée. Le processus de restauration de Microsoft comprend plus de 50 étapes manuelles, ce qui le rend lent, sujet aux erreurs et insuffisant pour les besoins de l'entreprise. La complexité de la procédure est suffisamment importante pour que Microsoft la propose dans le cadre d'ADRES (AD Recovery Execution Service), un engagement de service de 5 jours qui se concentre sur les problèmes de restauration d'AD.

De nombreuses entreprises ont mis en place des sites de reprise après sinistre dans Active Directory afin de fournir des DC de basculement aux utilisateurs et aux services en cas de défaillance du DC normal. Cependant, les sites de reprise après sinistre ou le nombre de DC dont vous disposez ne vous aideront pas en cas de corruption logique - ils rendront même la reprise plus compliquée.

C'est là que vous avez le choix entre une procédure manuelle à suivre ou une solution automatisée qui le fera pour vous.