SMART HDD. Расшифровка параметров.

Недав­но у ме­ня по­сы­пал­ся диск, как это ино­гда бы­ва­ет, неожи­дан­но, хо­тя бук­валь­но несколь­ко дней на­зад ин­фор­ма­ция чи­та­лась и за­пи­сы­ва­лась. Я по­те­рял зна­чи­тель­ную часть дан­ных, хо­тя са­мую важ­ную ин­фор­ма­цию уда­лось спа­сти. Всё это яви­лось след­стви­ем иг­но­ри­ро­ва­ния симп­то­мов на­коп­ле­ния оши­бок. Чтобы это­го не слу­ча­лось, необ­хо­ди­мо сле­дить за со­сто­я­ни­ем дис­ка, те­сти­ро­вать его пе­ри­о­ди­че­ски и глав­ное, все­гда (!) де­лать бэкап.

Для от­сле­жи­ва­ния нуж­но ис­поль­зо­вать при­ло­же­ния Victoria или CrystalDiskInfo под Windows. Для MacOs есть при­ло­же­ния с ин­тер­фей­сом, но я ре­ко­мен­дую ис­поль­зо­вать при­ло­же­ние smartctl, за­пус­ка­е­мую через тер­ми­нал, ко­то­рую мож­но ска­чать через сер­вис Brew.

01 Raw Read Error Rate

Этот ат­ри­бут под­ска­жет, сколь­ко раз воз­ни­ка­ли ошиб­ки чте­ния ин­фор­ма­ции, вы­зван­ные непо­лад­ка­ми са­мо­го вин­че­сте­ра. У Seagate, Fujitsu, Samsung здесь воз­ни­ка­ют огром­ные циф­ры, так как ис­прав­лен­ные ошиб­ки то­же учи­ты­ва­ют­ся.

У ста­рых Samsung и всех вин­че­сте­ров от WD зна­че­ние здесь не ме­ня­ет­ся.

02 Throughput Performance

Этот па­ра­метр, по идее, со­об­ща­ет об об­щей про­из­во­ди­тель­но­сти жёст­ко­го дис­ка. И чем мень­ше здесь по­ка­за­те­ли, тем бли­же устрой­ство к окон­ча­нию сро­ка служ­бы.

Но неиз­вест­но, как имен­но вы­чис­ля­ет­ся этот па­ра­метр и как оце­ни­ва­ет про­из­во­ди­тель­ность, так что учи­ты­вай­те его по сво­е­му же­ла­нию.

03 Spin-Up Time

Здесь го­во­рит­ся о вре­ме­ни, за ко­то­рое шпин­дель разо­гнал­ся до необ­хо­ди­мой ско­ро­сти во вре­мя по­след­не­го за­пус­ка устрой­ства.

По идее, ес­ли этот па­ра­метр рас­тёт, зна­чит, вин­че­стер из­на­ши­ва­ет­ся. Но так­же это мо­жет го­во­рить о недо­ста­точ­ном пи­та­нии, как на по­сто­ян­ной ос­но­ве, так и еди­но­жды, из-за скач­ка на­пря­же­ния.

04 Number of Spin-Up Times (Start/Stop Count)

По­ка­за­тель, со­об­ща­ю­щий о ко­ли­че­стве за­пус­ков шпин­де­ля, то есть сколь­ко раз за­пус­кал­ся диск. Он мо­жет быть ненуле­вым да­же у но­вых устройств, так как за­вод­ские про­ве­роч­ные за­пус­ки то­же учи­ты­ва­ют­ся.

Ино­гда у про­из­во­ди­те­лей, вро­де Seagate, здесь отоб­ра­жа­ет­ся ко­ли­че­ство раз ис­поль­зо­ва­ния энер­го­сбе­ре­га­ю­ще­го ре­жи­ма.

05 Reallocated Sector Count

Здесь по­ка­за­но, сколь­ко раз пе­ре­на­зна­ча­лись сек­то­ра и это один из важ­ней­ших пунк­тов.

Ес­ли со счи­ты­ва­ни­ем дан­ных с сек­то­ра воз­ни­ка­ют про­бле­мы, о сна­ча­ла ста­но­вит­ся кан­ди­да­том на пе­ре­на­зна­че­ние, а по­том ока­зы­ва­ет­ся пе­ре­на­зна­чен. С это­го мо­мен­та на него боль­ше ни­че­го не за­пи­сы­ва­ет­ся, и ни­че­го не чи­та­ет­ся, его роль ис­пол­ня­ет ре­зерв­ный ис­прав­ный сек­тор.

Так как по­доб­ная тех­но­ло­гия ис­поль­зо­ва­лась не все­гда, у ста­рых и но­вых вин­че­сте­ров здесь по-раз­но­му вы­чис­ля­ют­ся зна­че­ния. У пер­вых оно бу­дет ма­лень­ким, но при этом ко­ли­че­ство бэд-бло­ков — ве­ли­ко. У но­вых всё на­обо­рот.

Учи­ты­вай­те, что ре­зерв не бес­ко­не­чен и от­ту­да не по­лу­чит­ся по­сто­ян­но вы­тас­ки­вать све­жие сек­то­ра.

07 Seek Error Rate

Здесь го­во­рит­ся о том, как ча­сто маг­нит­ные го­лов­ки ста­но­вят­ся не на свои ме­ста. Чем ча­ще эти на­ру­ше­ния да­ют о се­бе знать, тем ху­же, ведь мож­но счи­тать, что вин­че­стер на гра­ни по­лом­ки.

Од­на­ко, учи­ты­вай­те, что уве­ли­чи­вать этот па­ра­метр мо­жет и из­лишне вы­со­кая тем­пе­ра­ту­ра устрой­ства.

08 Seek Time Performance

Здесь го­во­рит­ся, на­сколь­ко хо­ро­шо пе­ре­ме­ща­ют­ся маг­нит­ные го­лов­ки. Чем мед­лен­нее они ра­бо­та­ют, тем мед­лен­нее чи­та­ют­ся дан­ные.

Неиз­вест­но, в чём имен­но из­ме­ря­ет­ся зна­че­ние это­го ат­ри­бу­та. По­это­му труд­но пред­по­ло­жить, на­сколь­ко долж­но быть ве­ли­ко от­кло­не­ние от пер­во­на­чаль­но­го зна­че­ния, чтобы на­чать вол­но­вать­ся.

09 Power On Hours Count (Power-on Time)

Этот ат­ри­бут по­ка­зы­ва­ет, сколь­ко вре­ме­ни ваш на­ко­пи­тель про­вёл во вклю­чён­ном со­сто­я­нии в це­лом за свою жизнь. Здесь по­ро­го­вым зна­че­ни­ем бу­дет мак­си­маль­ное вре­мя вы­ра­бот­ки, уста­нов­лен­ное про­из­во­ди­те­лем. То есть его до­сти­же­ние не обя­за­тель­но бу­дет зна­чить мгно­вен­ную смерть устрой­ства, но от­сле­жи­вать этот па­ра­метр сто­ит.

10 (0А) Spin Retry Count

Здесь по­ка­за­но ко­ли­че­ство по­втор­ных за­пус­ков шпин­де­ля дис­ка. Ес­ли шпин­де­ли не за­пус­ка­ют­ся, устрой­ство ав­то­ма­ти­че­ски про­бу­ет сде­лать это ещё раз, и эти по­пыт­ки счи­та­ют­ся.

Это мо­жет го­во­рить о ме­ха­ни­че­ских непо­лад­ках устрой­ства, но мо­жет на­ме­кать и про­сто на недо­ста­ток пи­та­ния. Ес­ли здесь зна­че­ние боль­ше 2–3, по­смот­ри­те на связь жёст­ко­го дис­ка с бло­ком пи­та­ния, а уже по­том по­до­зре­вай­те по­вре­жде­ние са­мо­го дис­ка.

11 (0B) Calibration Retry Count (Recalibration Retries)

Этот по­ка­за­тель — ко­ли­че­ство по­пы­ток маг­нит­ных го­ло­вок вер­нуть­ся в из­на­чаль­ную по­зи­цию, ес­ли с пер­во­го ра­за не по­лу­чи­лось встать пра­виль­но.

То есть чем ча­ще это про­ис­хо­дит, тем ча­ще маг­нит­ные го­лов­ки ста­но­вят­ся непра­виль­но, что го­во­рит о ве­ро­ят­ных непо­лад­ках с на­ко­пи­те­лем па­мя­ти.

12 (0C) Power Cycle Count

Здесь го­во­рит­ся, как ча­сто диск про­хо­дил цикл «вклю­че­ние-вы­клю­че­ние». Чем боль­ше, тем ху­же, ко­неч­но, но слож­но по­нять, при ка­ких зна­че­ни­ях нуж­но за­ду­мы­вать­ся о по­куп­ке но­во­го устрой­ства.

183 (B7) SATA Downshift Error Count

Ино­гда так слу­ча­ет­ся, что на­ко­пи­тель па­мя­ти тре­бу­ет от SATA кон­трол­ле­ра сни­же­ния ско­ро­сти пе­ре­да­чи дан­ных. При­чи­ны у это­го мо­гут быть раз­ные, и они необя­за­тель­но се­рьёз­ные, про­сто ка­кие-то слу­чай­ные ошиб­ки.

В этом ат­ри­бу­те бу­дет за­пи­са­но, сколь­ко раз диск пы­тал­ся за­ста­вить кон­трол­лер SATA сбро­сить ско­рость. Ес­ли зна­че­ние по­ка­жет­ся вам слиш­ком боль­шим, по­про­буй­те за­ме­нить ка­бель SATA, это мо­жет сра­бо­тать.

184 (B8) End-to-End Error

Этот ат­ри­бут свя­зан с пе­ре­да­чей дан­ных через кэш жёст­ко­го дис­ка. Но у раз­ных про­из­во­ди­те­лей вин­че­сте­ров он зна­чит немно­го раз­ное.

На­при­мер, у HP здесь счи­та­ют­ся мо­мен­ты, ко­гда за­фик­си­ро­ва­но несов­па­де­ние ко­ли­че­ства дан­ных у ис­точ­ни­ка и по­лу­ча­те­ля. А у Kingston — ко­ли­че­ство воз­ник­но­ве­ния оши­бок, ко­гда дан­ные пы­та­ют­ся счи­тать из флеш-па­мя­ти.

187 (BB) Reported Uncorrected Sector Count (UNC Error)

По­ка­за­тель ко­ли­че­ства оши­бок, свя­зан­ных с чте­ни­ем дан­ных. Ес­ли эти про­бле­мы не бы­ли ис­прав­ле­ны ин­стру­мен­та­ми са­мо­го вин­че­сте­ра, как раз это сю­да и за­пи­сы­ва­ет­ся. Зна­че­ние здесь — ко­ли­че­ство сек­то­ров, пре­тен­ду­ю­щих на пе­ре­на­зна­че­ние, ес­ли при сле­ду­ю­щем за­пус­ке опять воз­ник­нут про­бле­мы чте­ния.

Обыч­но этот па­ра­метр учи­ты­ва­ет­ся в па­ре со 197.

188 (BC) Command Timeout

У вин­че­сте­ров есть мак­си­маль­ное вре­мя, сколь­ко они го­то­вы ожи­дать от­кли­ка от по­лу­ча­те­ля дан­ных. Ес­ли вре­мя ожи­да­ния ис­тек­ло, а связь так и не уста­но­ви­лась, ко­ли­че­ство по­доб­ных со­бы­тий за­пи­сы­ва­ет­ся в этот ат­ри­бут.

Та­кие ошиб­ки мо­гут воз­ни­кать из-за пло­хой свя­зи меж­ду на­ко­пи­те­лем па­мя­ти и ма­те­рин­ской пла­той, пло­хой свя­зи с бло­ком пи­та­ния, несов­ме­сти­мо­сти вин­че­сте­ра и пор­та SATA. Так­же та­кая про­бле­ма мо­жет воз­ни­кать из-за оши­бок Windows.

189 (BD) High Fly Writes

Здесь — ко­ли­че­ство слу­ча­ев, ко­гда вы­со­та на­хож­де­ния маг­нит­ной го­лов­ки дис­ка бы­ла вы­ше, чем рас­счи­та­но си­сте­мой. Та­кое слу­ча­ет­ся по раз­ным при­чи­нам, вро­де виб­ра­ций или внут­рен­них по­вре­жде­ний дис­ка.

190 (BE) Airflow Temperature

Этот ат­ри­бут под­ска­жет вам тем­пе­ра­ту­ру внут­ри кор­пу­са HDD или SSD. Но у раз­ных про­из­во­ди­те­лей это зна­че­ние рас­счи­ты­ва­ет­ся по-раз­но­му.

На­при­мер, у Seagate нуж­но вы­честь из 100 зна­че­ние HDA, у Western Digital — вы­честь его из 125. А у Hitachi, Samsung счи­тать ни­че­го не тре­бу­ет­ся.

191 (BF) G-Sensor Shock Count (Mechanical Shock)

Ко­ли­че­ство удар­ных на­гру­зок, ко­то­рые фик­си­ру­ет внут­рен­ний ак­се­ле­ро­метр.

Важ­но учи­ты­вать, что дат­чи­ки у всех про­из­во­ди­те­лей раз­ные, неко­то­рые бо­лее чув­стви­тель­ные, неко­то­рые — ме­нее. По­это­му сра­ба­ты­вать дат­чи­ки мо­гут и при аб­со­лют­но без­опас­ных ко­ле­ба­ни­ях.

192 (С0) Power Off Retract Count (Emergency Retry Count)

Здесь го­во­рит­ся о ко­ли­че­стве цик­лов вклю­че­ния/вы­клю­че­ния устрой­ства в ава­рий­ном ре­жи­ме, на­при­мер, из-за об­ры­ва пи­та­ния или из-за ре­ак­ции «дат­чи­ка па­де­ния».

У WD и Hitachi этот ат­ри­бут, как и №12, мо­жет по­ка­зы­вать про­сто ко­ли­че­ство прой­ден­ных ра­бо­чих цик­лов устрой­ства.

193 (С1) Load/Unload Cycle Count

Ат­ри­бут для обо­зна­че­ния ко­ли­че­ства цик­лов, при ко­то­рых маг­нит­ные го­лов­ки пе­ре­ме­ща­ют­ся в ра­бо­чее по­ло­же­ние и воз­вра­ща­ют­ся об­рат­но. То есть ко­ли­че­ство успеш­ных ра­бо­чих за­пус­ков.

194 (С2) Temperature (HDA Temperature, HDD Temperature)

Здесь по­ка­зы­ва­ют те­ку­щую, а так­же наи­мень­шую и наи­боль­шую тем­пе­ра­ту­ры вин­че­сте­ра. Так как внут­ри на­ко­пи­те­лей па­мя­ти все­гда есть тем­пе­ра­тур­ные дат­чи­ки, зна­че­ния здесь мож­но счи­тать до­ста­точ­но точ­ны­ми.

Ес­ли у вас SSD, то здесь бу­дет по­ка­за­на тем­пе­ра­ту­ра внут­ри кор­пу­са. Так вы смо­же­те сле­дить, не слиш­ком ли пе­ре­гре­ва­ют­ся ва­ши устрой­ства, хва­та­ет ли им охла­жде­ния.

195 (С3) Hardware ECC Recovered

Ат­ри­бут, го­во­ря­щий, сколь­ко оши­бок бы­ло ре­ше­но сред­ства­ми ECC. Зна­че­ние здесь ино­гда по­вы­ша­ет­ся и из-за раз­го­нов си­стем­ной ши­ны, кон­трол­лер SATA к это­му чув­стви­те­лен.

196 (С4) Reallocated Event Count

Здесь по­ка­за­но, сколь­ко раз си­сте­ма ини­ци­и­ро­ва­ла пе­ре­на­зна­че­ние сек­то­ров. Чем боль­ше зна­че­ние, тем ху­же, хо­тя здесь по­ка­за­те­ли рас­тут, да­же ес­ли пе­ре­на­зна­че­ния про­шли без про­блем.

Рас­смат­ри­вай­те ат­ри­бут в па­ре с №05, по­то­му что ча­сто они рас­тут од­новре­мен­но.

197 (С5) Current Pending Sector Count

В этом ат­ри­бу­те вы уви­ди­те, сколь­ко за­фик­си­ро­ва­но по­тен­ци­аль­но по­вре­ждён­ных сек­то­ров. Они не обя­за­тель­но ис­пор­чен­ные, но со счи­ты­ва­ни­ем дан­ных с них воз­ник­ли труд­но­сти.

Ес­ли в сле­ду­ю­щий раз сек­тор про­чтёт­ся, как дол­жен, он бу­дет ис­клю­чён из спис­ка, ес­ли ошиб­ки по­вто­рят­ся — ока­жет­ся пе­ре­на­зна­чен.

198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Чис­ло сек­то­ров дис­ка, недо­ступ­ных для вос­ста­нов­ле­ния. Ес­ли чис­ло та­ких кри­ти­че­ских де­фек­тов стре­ми­тель­но рас­тёт, зна­чит диск со­всем ско­ро мо­жет вый­ти из строя.

199 (С7) UltraDMA CRC Error Count

Обыч­но этот ат­ри­бут го­во­рит о про­бле­мах со шлей­фом, со­еди­ня­ю­щим жёст­кий диск с осталь­ной си­сте­мой ПК. Он мо­жет быть иметь по­вре­жде­ния или про­сто быть пе­ре­кру­чен­ным и мя­тым, мог­ли ис­пор­тить­ся кон­так­ты.

Зна­че­ние здесь рас­тёт так­же при раз­го­нах ши­ны PCI, про­бле­мах с пи­та­ни­ем устрой­ства, ино­гда да­же из-за кон­флик­та драй­ве­ров.

В об­щем, по­про­буй­те за­ме­нить или при­ве­сти в по­ря­док ка­бель, со­еди­ня­ю­щий вин­че­стер с си­стем­ной пла­той и бло­ком пи­та­ния, а по­том про­ве­ряй­те всё осталь­ное.

200 (С8) Write Error Rate (MultiZone Error Rate)

Этот по­ка­за­тель под­ска­жет вам, сколь­ко раз си­сте­ма стал­ки­ва­лась с ошиб­ка­ми чте­ния дан­ных на на­ко­пи­те­ле па­мя­ти.

Ес­ли чис­ло этих оши­бок ве­ли­ко и быст­ро рас­тёт, лег­ко сде­лать вы­вод, что устрой­ство уже близ­ко к окон­ча­нию сво­е­го сро­ка служ­бы.

201 (С9) Soft Read Error Rate

Здесь го­во­рит­ся о том, сколь­ко раз ошиб­ки чте­ния по­яв­ля­лись из-за про­блем с ПО, ко­то­рое ини­ци­и­ру­ет чте­ние, а не из-за по­вре­жде­ний са­мо­го на­ко­пи­те­ля па­мя­ти.

Ес­ли у вас SSD, а не HDD, то здесь бу­дет по­ка­за­но, сколь­ко оши­бок чте­ния ис­прав­ле­на сто­рон­ни­ми ме­то­да­ми, а не ECC.

202 (СА) Data Address Mark Error

У это­го па­ра­мет­ра обыч­но нет ка­ко­го-то по­нят­но­го опи­са­ния. Он ин­фор­ма­ци­он­ный, и зна­че­ния здесь за­ви­сят от про­из­во­ди­те­ля на­ко­пи­те­ля.

Но обыч­но го­во­рят, что он не со­дер­жит ни­че­го та­ко­го, что на­мек­ну­ло бы вам на срок жиз­ни про­ве­ря­е­мо­го устрой­ства.

203 (CB) Run Out Cancel

Здесь го­во­рит­ся о ко­ли­че­стве оши­бок ECC. Не уточ­ня­ет­ся, ис­прав­ле­ны они или нет, про­сто го­во­рит­ся о том, сколь­ко за­фик­си­ро­ва­но за вре­мя ис­поль­зо­ва­ния вин­че­сте­ра.

220 (DC) Disk Shift

Зна­че­ние здесь в неиз­вест­ных еди­ни­цах, но оно по­ка­зы­ва­ет, на­сколь­ко блок дис­ков сме­щён по от­но­ше­нию к шпин­де­лю.

По идее, сме­ще­ния во­об­ще быть не долж­но и по­яв­ля­ет­ся оно обыч­но из-за ме­ха­ни­че­ско­го по­вре­жде­ния дис­ка.

240 (F0) Head Flying Hours

Здесь по­ка­за­но в ча­сах, сколь­ко вре­ме­ни ра­бо­тал блок маг­нит­ных го­ло­вок.

Мож­но пред­по­ло­жить, что чем боль­ше вре­ме­ни, тем ху­же, но во­об­ще, это до­воль­но спор­но. Так что учи­ты­ва­е­те этот па­ра­метр по сво­е­му же­ла­нию.

254 (FE) Free Fall Event Count

Это ин­те­рес­ный па­ра­метр, на­вер­ное, са­мый ин­те­рес­ный из всех. Free Fall в на­зва­нии пе­ре­во­дит­ся как «Сво­бод­ное па­де­ние», и имен­но это и озна­ча­ет. Здесь бу­дет по­ка­за­но, сколь­ко раз па­да­ло ва­ше устрой­ство, ес­ли у него есть внут­ри дат­чи­ки опре­де­ля­ю­щие нор­маль­ное и ненор­маль­ное по­ве­де­ние в про­стран­стве. По­хо­жий па­ра­метр был и рань­ше, 191, но то­гда учи­ты­ва­лись все ано­маль­ные дви­же­ния, а здесь — толь­ко па­де­ния.

Мы рас­смот­ре­ли все необ­хо­ди­мые па­ра­мет­ры SMART с рас­шиф­ров­ка­ми, так что те­перь мо­же­те ис­поль­зо­вать этот ма­те­ри­ал в мо­мент ска­ни­ро­ва­ния дис­ка, чтобы при­нять ре­ше­ние о необ­хо­ди­мо­сти ле­че­ния. Вы смо­же­те сде­лать это как те­ми же са­мы­ми про­грам­ма­ми, вро­де Victoria, так и бо­лее слож­ным соф­том, по ти­пу HDD Regenerator.

P. S. Уста­нов­ка на MacOS smartctl через brew

От­крой­те Тер­ми­нал и вы­пол­ни­те сле­ду­ю­щую ко­ман­ду для уста­нов­ки smartmontools с по­мо­щью Homebrew:

brew install smartmontools

Чтобы узнать но­мер дис­ка, вы­пол­ни­те сле­ду­ю­щую ко­ман­ду:

diskutil list

Сле­ду­ю­щая ко­ман­да по­лу­ча­ет со­сто­я­ние SMART для ука­зан­но­го дис­ка:

smartctl -a diskX (X – но­мер дис­ка)

Это даст по­дроб­ный от­чет SMART в стан­дарт­ном вы­во­де. Ес­ли вы хо­ти­те со­хра­нить от­чет SMART на диск, вы мо­же­те от­пра­вить его в тек­сто­вый файл с управ­ля­ю­щим сим­во­лом & gt:

smartctl -a diskX & gt, diskhealthreport.txt