എങ്ങനെ ഡാറ്റ വീണ്ടെടുക്കാം, പരാജയപ്പെട്ട സോഫ്റ്റ്uവെയർ റെയിഡുകൾ പുനർനിർമ്മിക്കാം - ഭാഗം 8
ഈ RAID സീരീസിന്റെ മുൻ ലേഖനങ്ങളിൽ നിങ്ങൾ പൂജ്യത്തിൽ നിന്ന് RAID ഹീറോയിലേക്ക് പോയി. ഞങ്ങൾ നിരവധി സോഫ്uറ്റ്uവെയർ റെയ്uഡ് കോൺഫിഗറേഷനുകൾ അവലോകനം ചെയ്യുകയും ഓരോന്നിന്റെയും അവശ്യകാര്യങ്ങൾ വിശദീകരിക്കുകയും നിങ്ങളുടെ പ്രത്യേക സാഹചര്യത്തെ ആശ്രയിച്ച് നിങ്ങൾ ഒന്നോ അല്ലെങ്കിൽ മറ്റൊന്നിലേക്ക് ചായുകയോ ചെയ്യുന്നതിന്റെ കാരണങ്ങളും വിശദീകരിച്ചു.
ഒരു ഡിസ്ക് തകരാർ സംഭവിക്കുമ്പോൾ ഡാറ്റ നഷ്uടപ്പെടാതെ ഒരു സോഫ്റ്റ്uവെയർ റെയ്uഡ് അറേ എങ്ങനെ പുനർനിർമ്മിക്കാമെന്ന് ഈ ഗൈഡിൽ ഞങ്ങൾ ചർച്ച ചെയ്യും. സംക്ഷിപ്തതയ്ക്കായി, ഞങ്ങൾ ഒരു റെയിഡ് 1 സജ്ജീകരണം മാത്രമേ പരിഗണിക്കുകയുള്ളൂ - എന്നാൽ ആശയങ്ങളും കമാൻഡുകളും എല്ലാ കേസുകൾക്കും ഒരുപോലെ ബാധകമാണ്.
തുടരുന്നതിന് മുമ്പ്, ഈ സീരീസിന്റെ ഭാഗം 3-ൽ നൽകിയിരിക്കുന്ന നിർദ്ദേശങ്ങൾ പാലിച്ച് നിങ്ങൾ ഒരു റെയ്ഡ് 1 അറേ സജ്ജീകരിച്ചിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക: ലിനക്സിൽ റെയ്ഡ് 1 (മിറർ) എങ്ങനെ സജ്ജീകരിക്കാം.
ഞങ്ങളുടെ നിലവിലെ കേസിലെ ഒരേയൊരു വ്യതിയാനം ഇതായിരിക്കും:
1) ആ ലേഖനത്തിൽ (v6.5) ഉപയോഗിച്ചതിൽ നിന്ന് വ്യത്യസ്തമായ CentOS (v7) പതിപ്പ്, കൂടാതെ
2) /dev/sdb, /dev/sdc എന്നിവയ്uക്കായുള്ള വ്യത്യസ്ത ഡിസ്uക് വലുപ്പങ്ങൾ (8 GB വീതം).
കൂടാതെ, എൻഫോഴ്uസിംഗ് മോഡിൽ SELinux പ്രവർത്തനക്ഷമമാക്കിയിട്ടുണ്ടെങ്കിൽ, നിങ്ങൾ റെയിഡ് ഡിവൈസ് മൌണ്ട് ചെയ്യുന്ന ഡയറക്ടറിയിലേക്ക് അനുബന്ധ ലേബലുകൾ ചേർക്കേണ്ടതുണ്ട്. അല്ലെങ്കിൽ, മൌണ്ട് ചെയ്യാൻ ശ്രമിക്കുമ്പോൾ നിങ്ങൾ ഈ മുന്നറിയിപ്പ് സന്ദേശം കാണും:
പ്രവർത്തിപ്പിക്കുന്നതിലൂടെ നിങ്ങൾക്ക് ഇത് പരിഹരിക്കാനാകും:
# restorecon -R /mnt/raid1
റെയിഡ് മോണിറ്ററിംഗ് സജ്ജീകരിക്കുന്നു
ഒരു സംഭരണ ഉപകരണം പരാജയപ്പെടുന്നതിന് വിവിധ കാരണങ്ങളുണ്ട് (എസ്എസ്ഡികൾ ഇത് സംഭവിക്കാനുള്ള സാധ്യതയെ വളരെയധികം കുറച്ചിട്ടുണ്ട്, എന്നിരുന്നാലും), എന്നാൽ കാരണം പരിഗണിക്കാതെ തന്നെ പ്രശ്നങ്ങൾ എപ്പോൾ വേണമെങ്കിലും സംഭവിക്കുമെന്ന് നിങ്ങൾക്ക് ഉറപ്പുണ്ടായിരിക്കാം, പരാജയപ്പെട്ടത് മാറ്റിസ്ഥാപിക്കാൻ നിങ്ങൾ തയ്യാറാകേണ്ടതുണ്ട്. ഭാഗവും നിങ്ങളുടെ ഡാറ്റയുടെ ലഭ്യതയും സമഗ്രതയും ഉറപ്പാക്കാൻ.
ആദ്യം ഒരു ഉപദേശം. നിങ്ങളുടെ റെയ്uഡുകളുടെ നില പരിശോധിക്കുന്നതിനായി നിങ്ങൾക്ക് /proc/mdstat പരിശോധിക്കാൻ കഴിയുമ്പോൾ പോലും, മോണിറ്റർ + സ്കാൻ മോഡിൽ mdadm പ്രവർത്തിപ്പിക്കുന്നത് ഉൾക്കൊള്ളുന്ന മികച്ചതും സമയം ലാഭിക്കുന്നതുമായ ഒരു രീതിയുണ്ട്, അത് മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുള്ള സ്വീകർത്താവിന് ഇമെയിൽ വഴി അലേർട്ടുകൾ അയയ്ക്കും.
ഇത് സജ്ജീകരിക്കുന്നതിന്, /etc/mdadm.conf എന്നതിൽ ഇനിപ്പറയുന്ന വരി ചേർക്കുക:
MAILADDR [email <domain or localhost>
എന്റെ കാര്യത്തിൽ:
MAILADDR [email
മോണിറ്റർ + സ്കാൻ മോഡിൽ mdadm പ്രവർത്തിപ്പിക്കുന്നതിന്, ഇനിപ്പറയുന്ന ക്രോണ്ടാബ് എൻട്രി റൂട്ടായി ചേർക്കുക:
@reboot /sbin/mdadm --monitor --scan --oneshot
സ്ഥിരസ്ഥിതിയായി, mdadm ഓരോ 60 സെക്കൻഡിലും റെയ്uഡ് അറേകൾ പരിശോധിക്കുകയും ഒരു പ്രശ്uനം കണ്ടെത്തുകയാണെങ്കിൽ ഒരു മുന്നറിയിപ്പ് അയയ്uക്കുകയും ചെയ്യും. മുകളിലെ ക്രോണ്ടാബ് എൻട്രിയിലേക്ക് സെക്കൻഡുകളുടെ അളവ് (ഉദാഹരണത്തിന്, --delay
1800 എന്നാൽ 30 മിനിറ്റാണ്) --delay
ഓപ്ഷൻ ചേർത്ത് നിങ്ങൾക്ക് ഈ സ്വഭാവം പരിഷ്കരിക്കാനാകും.
അവസാനമായി, mutt അല്ലെങ്കിൽ mailx പോലുള്ള ഒരു മെയിൽ യൂസർ ഏജന്റ് (MUA) ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കുക. അല്ലെങ്കിൽ, നിങ്ങൾക്ക് അലേർട്ടുകളൊന്നും ലഭിക്കില്ല.
mdadm അയച്ച അലേർട്ട് എങ്ങനെയുണ്ടെന്ന് ഒരു മിനിറ്റിനുള്ളിൽ നമുക്ക് കാണാം.
പരാജയപ്പെട്ട ഒരു റെയിഡ് സ്റ്റോറേജ് ഡിവൈസ് അനുകരിക്കുകയും മാറ്റിസ്ഥാപിക്കുകയും ചെയ്യുന്നു
റെയിഡ് അറേയിലെ സ്റ്റോറേജ് ഡിവൈസുകളിലൊന്നിൽ ഒരു പ്രശ്നം അനുകരിക്കാൻ, ഞങ്ങൾ ഇനിപ്പറയുന്ന രീതിയിൽ --manage
, --set-faulty
ഓപ്ഷനുകൾ ഉപയോഗിക്കും:
# mdadm --manage --set-faulty /dev/md0 /dev/sdc1
ഇത് /dev/sdc1 തെറ്റായി അടയാളപ്പെടുത്തുന്നതിന് ഇടയാക്കും, നമുക്ക് /proc/mdstat-ൽ കാണാൻ കഴിയും:
ഏറ്റവും പ്രധാനമായി, ഇതേ മുന്നറിയിപ്പുള്ള ഒരു ഇമെയിൽ അലേർട്ട് ഞങ്ങൾക്ക് ലഭിച്ചോ എന്ന് നോക്കാം:
ഈ സാഹചര്യത്തിൽ, സോഫ്uറ്റ്uവെയർ റെയ്uഡ് അറേയിൽ നിന്ന് നിങ്ങൾ ഉപകരണം നീക്കംചെയ്യേണ്ടതുണ്ട്:
# mdadm /dev/md0 --remove /dev/sdc1
അതിനുശേഷം നിങ്ങൾക്ക് അത് മെഷീനിൽ നിന്ന് ഫിസിക്കൽ ആയി നീക്കം ചെയ്യാനും ഒരു സ്പെയർ പാർട് ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കാനും കഴിയും (/dev/sdd, ഇവിടെ മുമ്പ് fd എന്ന തരത്തിലുള്ള ഒരു പാർട്ടീഷൻ സൃഷ്ടിച്ചിട്ടുണ്ട്):
# mdadm --manage /dev/md0 --add /dev/sdd1
ഭാഗ്യവശാൽ, ഞങ്ങൾ ഇപ്പോൾ ചേർത്ത ഭാഗം ഉപയോഗിച്ച് സിസ്റ്റം യാന്ത്രികമായി അറേ പുനർനിർമ്മിക്കാൻ തുടങ്ങും. /dev/sdb1 തെറ്റായി അടയാളപ്പെടുത്തി, അറേയിൽ നിന്ന് നീക്കം ചെയ്uത്, tecmint.txt ഫയൽ ഇപ്പോഴും /mnt/raid1-ൽ ആക്uസസ് ചെയ്യാനാകുമെന്ന് ഉറപ്പാക്കിക്കൊണ്ട് നമുക്ക് ഇത് പരിശോധിക്കാം:
# mdadm --detail /dev/md0 # mount | grep raid1 # ls -l /mnt/raid1 | grep tecmint # cat /mnt/raid1/tecmint.txt
/dev/sdc1 ന് പകരമായി അറേയിലേക്ക് /dev/sdd1 ചേർത്തതിന് ശേഷം, ഡാറ്റയുടെ പുനർനിർമ്മാണം ഞങ്ങളുടെ ഭാഗത്തുനിന്ന് ഇടപെടാതെ തന്നെ സിസ്റ്റം സ്വയമേവ നിർവ്വഹിച്ചതായി മുകളിലെ ചിത്രം വ്യക്തമായി കാണിക്കുന്നു.
കർശനമായി ആവശ്യമില്ലെങ്കിലും, ഒരു സ്പെയർ ഉപകരണം കയ്യിൽ കരുതുന്നത് ഒരു മികച്ച ആശയമാണ്, അതുവഴി കേടായ ഉപകരണം ഒരു നല്ല ഡ്രൈവ് ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുന്ന പ്രക്രിയ ഒരു നിമിഷം കൊണ്ട് ചെയ്യാൻ കഴിയും. അത് ചെയ്യുന്നതിന്, നമുക്ക് /dev/sdb1, /dev/sdc1 എന്നിവ വീണ്ടും ചേർക്കാം:
# mdadm --manage /dev/md0 --add /dev/sdb1 # mdadm --manage /dev/md0 --add /dev/sdc1
ആവർത്തന നഷ്ടത്തിൽ നിന്ന് കരകയറുന്നു
നേരത്തെ വിശദീകരിച്ചതുപോലെ, ഒരു ഡിസ്ക് പരാജയപ്പെടുമ്പോൾ mdadm യാന്ത്രികമായി ഡാറ്റ പുനർനിർമ്മിക്കും. എന്നാൽ അറേയിലെ 2 ഡിസ്കുകൾ പരാജയപ്പെട്ടാൽ എന്ത് സംഭവിക്കും? /dev/sdb1, /dev/sdd1 എന്നിവ തെറ്റായി അടയാളപ്പെടുത്തി അത്തരം സാഹചര്യം നമുക്ക് അനുകരിക്കാം:
# umount /mnt/raid1 # mdadm --manage --set-faulty /dev/md0 /dev/sdb1 # mdadm --stop /dev/md0 # mdadm --manage --set-faulty /dev/md0 /dev/sdd1
ഈ സമയത്ത് സൃഷ്uടിച്ച അതേ രീതിയിൽ അറേ വീണ്ടും സൃഷ്uടിക്കാനുള്ള ശ്രമങ്ങൾ (അല്ലെങ്കിൽ --assume-clean
ഓപ്uഷൻ ഉപയോഗിച്ച്) ഡാറ്റ നഷ്uടപ്പെടാൻ ഇടയാക്കിയേക്കാം, അതിനാൽ ഇത് അവസാന ആശ്രയമായി ഉപേക്ഷിക്കണം.
ഉദാഹരണത്തിന്, /dev/sdb1-ൽ നിന്ന് ഡാറ്റ വീണ്ടെടുക്കാൻ ശ്രമിക്കാം, ഉദാഹരണത്തിന്, സമാനമായ ഡിസ്ക് പാർട്ടീഷനിലേക്ക് (/dev/sde1 - ഇത് തുടരുന്നതിന് മുമ്പ് /dev/sde-ൽ ddrescue ഉപയോഗിച്ച് fd ടൈപ്പിന്റെ ഒരു പാർട്ടീഷൻ സൃഷ്ടിക്കേണ്ടത് ആവശ്യമാണെന്ന് ശ്രദ്ധിക്കുക:
# ddrescue -r 2 /dev/sdb1 /dev/sde1
ഈ സമയം വരെ, ഞങ്ങൾ /dev/sdb അല്ലെങ്കിൽ /dev/sdd, RAID അറേയുടെ ഭാഗമായ പാർട്ടീഷനുകൾ സ്പർശിച്ചിട്ടില്ല എന്നത് ശ്രദ്ധിക്കുക.
ഇനി നമുക്ക് /dev/sde1, /dev/sdf1 എന്നിവ ഉപയോഗിച്ച് അറേ പുനർനിർമ്മിക്കാം:
# mdadm --create /dev/md0 --level=mirror --raid-devices=2 /dev/sd[e-f]1
ഒരു യഥാർത്ഥ സാഹചര്യത്തിൽ, നിങ്ങൾ സാധാരണയായി യഥാർത്ഥ അറേയിലെ അതേ ഉപകരണ നാമങ്ങൾ ഉപയോഗിക്കുമെന്നത് ശ്രദ്ധിക്കുക, അതായത്, പരാജയപ്പെട്ട ഡിസ്കുകൾ പുതിയവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിച്ചതിന് ശേഷം, /dev/sdb1, /dev/sdc1.
ഈ ലേഖനത്തിൽ, പുതിയ ഡിസ്കുകൾ ഉപയോഗിച്ച് അറേ പുനഃസൃഷ്ടിക്കുന്നതിനും യഥാർത്ഥ പരാജയപ്പെട്ട ഡ്രൈവുകളുമായി ആശയക്കുഴപ്പം ഒഴിവാക്കുന്നതിനും അധിക ഉപകരണങ്ങൾ ഉപയോഗിക്കാൻ ഞാൻ തിരഞ്ഞെടുത്തു.
അറേ എഴുതുന്നത് തുടരണോ എന്ന് ചോദിക്കുമ്പോൾ, Y എന്ന് ടൈപ്പ് ചെയ്ത് എന്റർ അമർത്തുക. അറേ ആരംഭിക്കണം, ഇതുപയോഗിച്ച് നിങ്ങൾക്ക് അതിന്റെ പുരോഗതി കാണാനാകും:
# watch -n 1 cat /proc/mdstat
പ്രക്രിയ പൂർത്തിയാകുമ്പോൾ, നിങ്ങളുടെ റെയ്ഡിന്റെ ഉള്ളടക്കം നിങ്ങൾക്ക് ആക്സസ് ചെയ്യാൻ കഴിയും:
സംഗ്രഹം
റെയ്ഡ് പരാജയങ്ങളിൽ നിന്നും ആവർത്തന നഷ്ടങ്ങളിൽ നിന്നും എങ്ങനെ വീണ്ടെടുക്കാമെന്ന് ഈ ലേഖനത്തിൽ ഞങ്ങൾ അവലോകനം ചെയ്തിട്ടുണ്ട്. എന്നിരുന്നാലും, ഈ സാങ്കേതികവിദ്യ ഒരു സംഭരണ പരിഹാരമാണെന്നും ബാക്കപ്പുകൾ മാറ്റിസ്ഥാപിക്കുന്നില്ലെന്നും നിങ്ങൾ ഓർക്കേണ്ടതുണ്ട്.
ഈ ഗൈഡിൽ വിശദീകരിച്ചിരിക്കുന്ന തത്ത്വങ്ങൾ എല്ലാ RAID സജ്ജീകരണങ്ങൾക്കും ഒരുപോലെ ബാധകമാണ്, കൂടാതെ ഈ ശ്രേണിയുടെ (RAID മാനേജ്മെന്റ്) അടുത്തതും അവസാനവുമായ ഗൈഡിൽ ഞങ്ങൾ ഉൾപ്പെടുത്തുന്ന ആശയങ്ങൾ.
ഈ ലേഖനത്തെക്കുറിച്ച് നിങ്ങൾക്ക് എന്തെങ്കിലും ചോദ്യങ്ങളുണ്ടെങ്കിൽ, ചുവടെയുള്ള അഭിപ്രായ ഫോം ഉപയോഗിച്ച് ഞങ്ങൾക്ക് ഒരു കുറിപ്പ് ഇടാൻ മടിക്കേണ്ടതില്ല. ഞങ്ങള് താങ്കള് പറയുന്നതു കേള്ക്കാനായി കാത്തിരിക്കുന്നു!