février 21, 2024

Résolution des problèmes de périphérique bloqué via /etc/fstab et Rescue Instance / Blogs / Perficient

Introduction
Dans cet article de blog, je partagerai mon expérience directe de la résolution et de la résolution d’un problème critique avec une instance EC2 inaccessible et défaillante. Je fournirai un compte rendu détaillé du problème, de son impact et de l’approche étape par étape que j’ai adoptée pour le résoudre. De plus, je partagerai des informations précieuses et des leçons apprises pour aider à prévenir des problèmes similaires à l’avenir.
Aperçu
Une instance EC2 a été confrontée à des échecs de vérification de l’état de l’instance et était inaccessible via SSM en raison d’un processus de démarrage passant en mode d’urgence. Après avoir analysé le journal de démarrage du système d’exploitation, il a été identifié que le problème provenait d’une défaillance du point de montage provoquée par un périphérique de bloc secondaire mal formé/manquant. Vous pouvez suivre plusieurs étapes pour dépanner et résoudre le problème.

Avantages de la récupération d’instance EC2

Diagnostic et résolution rapides
Atténuation efficace
Localisation précise des problèmes
Temps d’arrêt minimal
Restauration de l’accès SSM (Systems Manager)

Voici un guide général pour vous aider à identifier et à résoudre le problème :
Étape 1 : Vérifier l’état de l’instance:

Accédez à la console de gestion AWS.
Accédez au tableau de bord EC2 et sélectionnez « Instances ».
Identifiez l’instance problématique et vérifiez les contrôles d’état.
Il existe deux types : « Vérifications de l’état du système » et « Vérifications de l’état de l’instance ».
Recherchez les messages d’erreur spécifiques qui peuvent fournir des informations sur le problème.

Étape 2 : Vérifiez les journaux système :

Consultez les journaux système de l’instance pour recueillir plus d’informations sur le problème sous-jacent.
Accédez à l’instance AWS EC2 et accédez à « Action » -> « Surveiller et dépanner » pour afficher les journaux.

Étape 3 : Vérifiez les autorisations des rôles IAM :

Assurez-vous que le rôle IAM associé à l’instance EC2 dispose des autorisations nécessaires pour SSM (System Manager).
Le rôle devrait avoir le ‘AmazonSSMManagedInstanceCore‘ politique ci-jointe.
Si la politique mentionnée n’est pas jointe, vous devez la joindre.

Certes, si le problème est lié à un nom de périphérique mal formé dans le /etc/fstab fichier, vous pouvez suivre les étapes ci-dessous pour le corriger :

1. Lancez une instance de secours :

Lancez une nouvelle instance EC2 dans la même région que votre instance problématique. Cette instance sera utilisée pour monter le volume racine de l’instance problématique.

2. Arrêtez l’instance problématique :

Arrêtez l’instance EC2 problématique pour détacher son volume racine.

3. Détachez le volume racine de l’instance problématique :

Accédez à la console de gestion AWS -> Accédez au tableau de bord EC2 et sélectionnez « Volumes ». -> Identifiez le volume racine attaché à l’instance problématique et détachez-le.

4. Attachez le volume racine à l’instance de secours :

Attachez le volume racine de l’instance problématique à l’instance de secours. Notez le nom du périphérique auquel il est attaché (par exemple, /dev/xvdf).

5. Accédez à l’instance de secours :

Connectez-vous à l’instance de secours à l’aide de SSH ou d’autres méthodes.

Montez le volume racine :

Créez un répertoire pour monter le volume racine. Par exemple: sudo mkdir /mnt/rescue
Montez le volume racine sur l’instance de secours : sudo mount /dev/xvdf1 /mnt/rescue
Editez le fichier /etc/fstab : Ouvrez le fichier /etc/fstab pour le modifier :
Vous pouvez utiliser un éditeur de texte tel que nano ou vim : sudo nano /mnt/rescue/etc/fstab

Recherchez l’entrée qui correspond au périphérique de bloc secondaire et corrigez le nom du périphérique. Assurez-vous que le nom du périphérique correspond au nom de périphérique réel du volume connecté.

Sauvegarder et quitter:

Enregistrez les modifications dans le fichier /etc/fstab et quittez l’éditeur de texte.
Démontez le volume racine : sudo umount /mnt/rescue
Détacher le volume racine de l’instance de secours

6. Rattachez le volume racine à l’instance problématique :

Revenez à AWS Management Console.
Attachez le volume racine à l’instance problématique en utilisant le nom de périphérique d’origine.
Démarrez l’instance problématique : Démarrez l’instance problématique et surveillez ses vérifications d’état pour vous assurer qu’elle se met en ligne avec succès.

Ce processus implique de corriger le fichier /etc/fstab sur le volume racine en le montant sur une instance de secours. Une fois corrigé, vous pouvez rattacher le volume à l’instance d’origine et le démarrer pour vérifier si le problème est résolu. Faites toujours preuve de prudence lorsque vous effectuez des opérations sur des instances de production et assurez-vous de disposer de sauvegardes ou d’instantanés avant d’apporter des modifications.

Conclusion:

La résolution des échecs de vérification de l’état des instances EC2 implique une approche systématique pour identifier et résoudre les problèmes sous-jacents. Les causes courantes incluent des problèmes de réseau, des problèmes de système d’exploitation, des ressources insuffisantes, des problèmes de stockage et des problèmes de configuration d’AMI ou d’instance.

Blog ARC Optimizer

février 21, 2024

Résolution des problèmes de périphérique bloqué via /etc/fstab et Rescue Instance / Blogs / Perficient

Articles similaires

Blog ARC Optimizer

Partager :

Articles similaires