എങ്ങനെ ഡാറ്റ വീണ്ടെടുക്കാം, പരാജയപ്പെട്ട സോഫ്റ്റ്uവെയർ റെയിഡുകൾ പുനർനിർമ്മിക്കാം - ഭാഗം 8


ഈ RAID സീരീസിന്റെ മുൻ ലേഖനങ്ങളിൽ നിങ്ങൾ പൂജ്യത്തിൽ നിന്ന് RAID ഹീറോയിലേക്ക് പോയി. ഞങ്ങൾ നിരവധി സോഫ്uറ്റ്uവെയർ റെയ്uഡ് കോൺഫിഗറേഷനുകൾ അവലോകനം ചെയ്യുകയും ഓരോന്നിന്റെയും അവശ്യകാര്യങ്ങൾ വിശദീകരിക്കുകയും നിങ്ങളുടെ പ്രത്യേക സാഹചര്യത്തെ ആശ്രയിച്ച് നിങ്ങൾ ഒന്നോ അല്ലെങ്കിൽ മറ്റൊന്നിലേക്ക് ചായുകയോ ചെയ്യുന്നതിന്റെ കാരണങ്ങളും വിശദീകരിച്ചു.

ഒരു ഡിസ്ക് തകരാർ സംഭവിക്കുമ്പോൾ ഡാറ്റ നഷ്uടപ്പെടാതെ ഒരു സോഫ്റ്റ്uവെയർ റെയ്uഡ് അറേ എങ്ങനെ പുനർനിർമ്മിക്കാമെന്ന് ഈ ഗൈഡിൽ ഞങ്ങൾ ചർച്ച ചെയ്യും. സംക്ഷിപ്തതയ്ക്കായി, ഞങ്ങൾ ഒരു റെയിഡ് 1 സജ്ജീകരണം മാത്രമേ പരിഗണിക്കുകയുള്ളൂ - എന്നാൽ ആശയങ്ങളും കമാൻഡുകളും എല്ലാ കേസുകൾക്കും ഒരുപോലെ ബാധകമാണ്.

തുടരുന്നതിന് മുമ്പ്, ഈ സീരീസിന്റെ ഭാഗം 3-ൽ നൽകിയിരിക്കുന്ന നിർദ്ദേശങ്ങൾ പാലിച്ച് നിങ്ങൾ ഒരു റെയ്ഡ് 1 അറേ സജ്ജീകരിച്ചിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക: ലിനക്സിൽ റെയ്ഡ് 1 (മിറർ) എങ്ങനെ സജ്ജീകരിക്കാം.

ഞങ്ങളുടെ നിലവിലെ കേസിലെ ഒരേയൊരു വ്യതിയാനം ഇതായിരിക്കും:

1) ആ ലേഖനത്തിൽ (v6.5) ഉപയോഗിച്ചതിൽ നിന്ന് വ്യത്യസ്തമായ CentOS (v7) പതിപ്പ്, കൂടാതെ
2) /dev/sdb, /dev/sdc എന്നിവയ്uക്കായുള്ള വ്യത്യസ്ത ഡിസ്uക് വലുപ്പങ്ങൾ (8 GB വീതം).

കൂടാതെ, എൻഫോഴ്uസിംഗ് മോഡിൽ SELinux പ്രവർത്തനക്ഷമമാക്കിയിട്ടുണ്ടെങ്കിൽ, നിങ്ങൾ റെയിഡ് ഡിവൈസ് മൌണ്ട് ചെയ്യുന്ന ഡയറക്ടറിയിലേക്ക് അനുബന്ധ ലേബലുകൾ ചേർക്കേണ്ടതുണ്ട്. അല്ലെങ്കിൽ, മൌണ്ട് ചെയ്യാൻ ശ്രമിക്കുമ്പോൾ നിങ്ങൾ ഈ മുന്നറിയിപ്പ് സന്ദേശം കാണും:

പ്രവർത്തിപ്പിക്കുന്നതിലൂടെ നിങ്ങൾക്ക് ഇത് പരിഹരിക്കാനാകും:

# restorecon -R /mnt/raid1

റെയിഡ് മോണിറ്ററിംഗ് സജ്ജീകരിക്കുന്നു

ഒരു സംഭരണ ഉപകരണം പരാജയപ്പെടുന്നതിന് വിവിധ കാരണങ്ങളുണ്ട് (എസ്എസ്ഡികൾ ഇത് സംഭവിക്കാനുള്ള സാധ്യതയെ വളരെയധികം കുറച്ചിട്ടുണ്ട്, എന്നിരുന്നാലും), എന്നാൽ കാരണം പരിഗണിക്കാതെ തന്നെ പ്രശ്നങ്ങൾ എപ്പോൾ വേണമെങ്കിലും സംഭവിക്കുമെന്ന് നിങ്ങൾക്ക് ഉറപ്പുണ്ടായിരിക്കാം, പരാജയപ്പെട്ടത് മാറ്റിസ്ഥാപിക്കാൻ നിങ്ങൾ തയ്യാറാകേണ്ടതുണ്ട്. ഭാഗവും നിങ്ങളുടെ ഡാറ്റയുടെ ലഭ്യതയും സമഗ്രതയും ഉറപ്പാക്കാൻ.

ആദ്യം ഒരു ഉപദേശം. നിങ്ങളുടെ റെയ്uഡുകളുടെ നില പരിശോധിക്കുന്നതിനായി നിങ്ങൾക്ക് /proc/mdstat പരിശോധിക്കാൻ കഴിയുമ്പോൾ പോലും, മോണിറ്റർ + സ്കാൻ മോഡിൽ mdadm പ്രവർത്തിപ്പിക്കുന്നത് ഉൾക്കൊള്ളുന്ന മികച്ചതും സമയം ലാഭിക്കുന്നതുമായ ഒരു രീതിയുണ്ട്, അത് മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുള്ള സ്വീകർത്താവിന് ഇമെയിൽ വഴി അലേർട്ടുകൾ അയയ്ക്കും.

ഇത് സജ്ജീകരിക്കുന്നതിന്, /etc/mdadm.conf എന്നതിൽ ഇനിപ്പറയുന്ന വരി ചേർക്കുക:

MAILADDR [email <domain or localhost>

എന്റെ കാര്യത്തിൽ:

MAILADDR [email 

മോണിറ്റർ + സ്കാൻ മോഡിൽ mdadm പ്രവർത്തിപ്പിക്കുന്നതിന്, ഇനിപ്പറയുന്ന ക്രോണ്ടാബ് എൻട്രി റൂട്ടായി ചേർക്കുക:

@reboot /sbin/mdadm --monitor --scan --oneshot

സ്ഥിരസ്ഥിതിയായി, mdadm ഓരോ 60 സെക്കൻഡിലും റെയ്uഡ് അറേകൾ പരിശോധിക്കുകയും ഒരു പ്രശ്uനം കണ്ടെത്തുകയാണെങ്കിൽ ഒരു മുന്നറിയിപ്പ് അയയ്uക്കുകയും ചെയ്യും. മുകളിലെ ക്രോണ്ടാബ് എൻട്രിയിലേക്ക് സെക്കൻഡുകളുടെ അളവ് (ഉദാഹരണത്തിന്, --delay 1800 എന്നാൽ 30 മിനിറ്റാണ്) --delay ഓപ്ഷൻ ചേർത്ത് നിങ്ങൾക്ക് ഈ സ്വഭാവം പരിഷ്കരിക്കാനാകും.

അവസാനമായി, mutt അല്ലെങ്കിൽ mailx പോലുള്ള ഒരു മെയിൽ യൂസർ ഏജന്റ് (MUA) ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക. അല്ലെങ്കിൽ, നിങ്ങൾക്ക് അലേർട്ടുകളൊന്നും ലഭിക്കില്ല.

mdadm അയച്ച അലേർട്ട് എങ്ങനെയുണ്ടെന്ന് ഒരു മിനിറ്റിനുള്ളിൽ നമുക്ക് കാണാം.

പരാജയപ്പെട്ട ഒരു റെയിഡ് സ്റ്റോറേജ് ഡിവൈസ് അനുകരിക്കുകയും മാറ്റിസ്ഥാപിക്കുകയും ചെയ്യുന്നു

റെയിഡ് അറേയിലെ സ്റ്റോറേജ് ഡിവൈസുകളിലൊന്നിൽ ഒരു പ്രശ്നം അനുകരിക്കാൻ, ഞങ്ങൾ ഇനിപ്പറയുന്ന രീതിയിൽ --manage, --set-faulty ഓപ്ഷനുകൾ ഉപയോഗിക്കും:

# mdadm --manage --set-faulty /dev/md0 /dev/sdc1  

ഇത് /dev/sdc1 തെറ്റായി അടയാളപ്പെടുത്തുന്നതിന് ഇടയാക്കും, നമുക്ക് /proc/mdstat-ൽ കാണാൻ കഴിയും:

ഏറ്റവും പ്രധാനമായി, ഇതേ മുന്നറിയിപ്പുള്ള ഒരു ഇമെയിൽ അലേർട്ട് ഞങ്ങൾക്ക് ലഭിച്ചോ എന്ന് നോക്കാം:

ഈ സാഹചര്യത്തിൽ, സോഫ്uറ്റ്uവെയർ റെയ്uഡ് അറേയിൽ നിന്ന് നിങ്ങൾ ഉപകരണം നീക്കംചെയ്യേണ്ടതുണ്ട്:

# mdadm /dev/md0 --remove /dev/sdc1

അതിനുശേഷം നിങ്ങൾക്ക് അത് മെഷീനിൽ നിന്ന് ഫിസിക്കൽ ആയി നീക്കം ചെയ്യാനും ഒരു സ്പെയർ പാർട് ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കാനും കഴിയും (/dev/sdd, ഇവിടെ മുമ്പ് fd എന്ന തരത്തിലുള്ള ഒരു പാർട്ടീഷൻ സൃഷ്ടിച്ചിട്ടുണ്ട്):

# mdadm --manage /dev/md0 --add /dev/sdd1

ഭാഗ്യവശാൽ, ഞങ്ങൾ ഇപ്പോൾ ചേർത്ത ഭാഗം ഉപയോഗിച്ച് സിസ്റ്റം യാന്ത്രികമായി അറേ പുനർനിർമ്മിക്കാൻ തുടങ്ങും. /dev/sdb1 തെറ്റായി അടയാളപ്പെടുത്തി, അറേയിൽ നിന്ന് നീക്കം ചെയ്uത്, tecmint.txt ഫയൽ ഇപ്പോഴും /mnt/raid1-ൽ ആക്uസസ് ചെയ്യാനാകുമെന്ന് ഉറപ്പാക്കിക്കൊണ്ട് നമുക്ക് ഇത് പരിശോധിക്കാം:

# mdadm --detail /dev/md0
# mount | grep raid1
# ls -l /mnt/raid1 | grep tecmint
# cat /mnt/raid1/tecmint.txt

/dev/sdc1 ന് പകരമായി അറേയിലേക്ക് /dev/sdd1 ചേർത്തതിന് ശേഷം, ഡാറ്റയുടെ പുനർനിർമ്മാണം ഞങ്ങളുടെ ഭാഗത്തുനിന്ന് ഇടപെടാതെ തന്നെ സിസ്റ്റം സ്വയമേവ നിർവ്വഹിച്ചതായി മുകളിലെ ചിത്രം വ്യക്തമായി കാണിക്കുന്നു.

കർശനമായി ആവശ്യമില്ലെങ്കിലും, ഒരു സ്പെയർ ഉപകരണം കയ്യിൽ കരുതുന്നത് ഒരു മികച്ച ആശയമാണ്, അതുവഴി കേടായ ഉപകരണം ഒരു നല്ല ഡ്രൈവ് ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്ന പ്രക്രിയ ഒരു നിമിഷം കൊണ്ട് ചെയ്യാൻ കഴിയും. അത് ചെയ്യുന്നതിന്, നമുക്ക് /dev/sdb1, /dev/sdc1 എന്നിവ വീണ്ടും ചേർക്കാം:

# mdadm --manage /dev/md0 --add /dev/sdb1
# mdadm --manage /dev/md0 --add /dev/sdc1

ആവർത്തന നഷ്ടത്തിൽ നിന്ന് കരകയറുന്നു

നേരത്തെ വിശദീകരിച്ചതുപോലെ, ഒരു ഡിസ്ക് പരാജയപ്പെടുമ്പോൾ mdadm യാന്ത്രികമായി ഡാറ്റ പുനർനിർമ്മിക്കും. എന്നാൽ അറേയിലെ 2 ഡിസ്കുകൾ പരാജയപ്പെട്ടാൽ എന്ത് സംഭവിക്കും? /dev/sdb1, /dev/sdd1 എന്നിവ തെറ്റായി അടയാളപ്പെടുത്തി അത്തരം സാഹചര്യം നമുക്ക് അനുകരിക്കാം:

# umount /mnt/raid1
# mdadm --manage --set-faulty /dev/md0 /dev/sdb1
# mdadm --stop /dev/md0
# mdadm --manage --set-faulty /dev/md0 /dev/sdd1

ഈ സമയത്ത് സൃഷ്uടിച്ച അതേ രീതിയിൽ അറേ വീണ്ടും സൃഷ്uടിക്കാനുള്ള ശ്രമങ്ങൾ (അല്ലെങ്കിൽ --assume-clean ഓപ്uഷൻ ഉപയോഗിച്ച്) ഡാറ്റ നഷ്uടപ്പെടാൻ ഇടയാക്കിയേക്കാം, അതിനാൽ ഇത് അവസാന ആശ്രയമായി ഉപേക്ഷിക്കണം.

ഉദാഹരണത്തിന്, /dev/sdb1-ൽ നിന്ന് ഡാറ്റ വീണ്ടെടുക്കാൻ ശ്രമിക്കാം, ഉദാഹരണത്തിന്, സമാനമായ ഡിസ്ക് പാർട്ടീഷനിലേക്ക് (/dev/sde1 - ഇത് തുടരുന്നതിന് മുമ്പ് /dev/sde-ൽ ddrescue ഉപയോഗിച്ച് fd ടൈപ്പിന്റെ ഒരു പാർട്ടീഷൻ സൃഷ്ടിക്കേണ്ടത് ആവശ്യമാണെന്ന് ശ്രദ്ധിക്കുക:

# ddrescue -r 2 /dev/sdb1 /dev/sde1

ഈ സമയം വരെ, ഞങ്ങൾ /dev/sdb അല്ലെങ്കിൽ /dev/sdd, RAID അറേയുടെ ഭാഗമായ പാർട്ടീഷനുകൾ സ്പർശിച്ചിട്ടില്ല എന്നത് ശ്രദ്ധിക്കുക.

ഇനി നമുക്ക് /dev/sde1, /dev/sdf1 എന്നിവ ഉപയോഗിച്ച് അറേ പുനർനിർമ്മിക്കാം:

# mdadm --create /dev/md0 --level=mirror --raid-devices=2 /dev/sd[e-f]1

ഒരു യഥാർത്ഥ സാഹചര്യത്തിൽ, നിങ്ങൾ സാധാരണയായി യഥാർത്ഥ അറേയിലെ അതേ ഉപകരണ നാമങ്ങൾ ഉപയോഗിക്കുമെന്നത് ശ്രദ്ധിക്കുക, അതായത്, പരാജയപ്പെട്ട ഡിസ്കുകൾ പുതിയവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിച്ചതിന് ശേഷം, /dev/sdb1, /dev/sdc1.

ഈ ലേഖനത്തിൽ, പുതിയ ഡിസ്കുകൾ ഉപയോഗിച്ച് അറേ പുനഃസൃഷ്ടിക്കുന്നതിനും യഥാർത്ഥ പരാജയപ്പെട്ട ഡ്രൈവുകളുമായി ആശയക്കുഴപ്പം ഒഴിവാക്കുന്നതിനും അധിക ഉപകരണങ്ങൾ ഉപയോഗിക്കാൻ ഞാൻ തിരഞ്ഞെടുത്തു.

അറേ എഴുതുന്നത് തുടരണോ എന്ന് ചോദിക്കുമ്പോൾ, Y എന്ന് ടൈപ്പ് ചെയ്ത് എന്റർ അമർത്തുക. അറേ ആരംഭിക്കണം, ഇതുപയോഗിച്ച് നിങ്ങൾക്ക് അതിന്റെ പുരോഗതി കാണാനാകും:

# watch -n 1 cat /proc/mdstat

പ്രക്രിയ പൂർത്തിയാകുമ്പോൾ, നിങ്ങളുടെ റെയ്ഡിന്റെ ഉള്ളടക്കം നിങ്ങൾക്ക് ആക്സസ് ചെയ്യാൻ കഴിയും:

സംഗ്രഹം

റെയ്ഡ് പരാജയങ്ങളിൽ നിന്നും ആവർത്തന നഷ്ടങ്ങളിൽ നിന്നും എങ്ങനെ വീണ്ടെടുക്കാമെന്ന് ഈ ലേഖനത്തിൽ ഞങ്ങൾ അവലോകനം ചെയ്തിട്ടുണ്ട്. എന്നിരുന്നാലും, ഈ സാങ്കേതികവിദ്യ ഒരു സംഭരണ പരിഹാരമാണെന്നും ബാക്കപ്പുകൾ മാറ്റിസ്ഥാപിക്കുന്നില്ലെന്നും നിങ്ങൾ ഓർക്കേണ്ടതുണ്ട്.

ഈ ഗൈഡിൽ വിശദീകരിച്ചിരിക്കുന്ന തത്ത്വങ്ങൾ എല്ലാ RAID സജ്ജീകരണങ്ങൾക്കും ഒരുപോലെ ബാധകമാണ്, കൂടാതെ ഈ ശ്രേണിയുടെ (RAID മാനേജ്മെന്റ്) അടുത്തതും അവസാനവുമായ ഗൈഡിൽ ഞങ്ങൾ ഉൾപ്പെടുത്തുന്ന ആശയങ്ങൾ.

ഈ ലേഖനത്തെക്കുറിച്ച് നിങ്ങൾക്ക് എന്തെങ്കിലും ചോദ്യങ്ങളുണ്ടെങ്കിൽ, ചുവടെയുള്ള അഭിപ്രായ ഫോം ഉപയോഗിച്ച് ഞങ്ങൾക്ക് ഒരു കുറിപ്പ് ഇടാൻ മടിക്കേണ്ടതില്ല. ഞങ്ങള് താങ്കള് പറയുന്നതു കേള്ക്കാനായി കാത്തിരിക്കുന്നു!