SMART HDD. Расшифровка параметров.

16 декабря 2023, 10:53 Техника 1193

Недавно у меня посыпался диск, как это иногда бывает, неожиданно, хотя буквально несколько дней назад информация читалась и записывалась. Я потерял значительную часть данных, хотя самую важную информацию удалось спасти. Всё это явилось следствием игнорирования симптомов накопления ошибок. Чтобы этого не случалось, необходимо следить за состоянием диска, тестировать его периодически и главное, всегда (!) делать бэкап.

Для отслеживания нужно использовать приложения Victoria или CrystalDiskInfo под Windows. Для MacOs есть приложения с интерфейсом, но я рекомендую использовать приложение smartctl, запускаемую через терминал, которую можно скачать через сервис Brew.

01 Raw Read Error Rate

Этот атрибут подскажет, сколько раз возникали ошибки чтения информации, вызванные неполадками самого винчестера. У Seagate, Fujitsu, Samsung здесь возникают огромные цифры, так как исправленные ошибки тоже учитываются.

У старых Samsung и всех винчестеров от WD значение здесь не меняется.

02 Throughput Performance

Этот параметр, по идее, сообщает об общей производительности жёсткого диска. И чем меньше здесь показатели, тем ближе устройство к окончанию срока службы.

Но неизвестно, как именно вычисляется этот параметр и как оценивает производительность, так что учитывайте его по своему желанию.

03 Spin-Up Time

Здесь говорится о времени, за которое шпиндель разогнался до необходимой скорости во время последнего запуска устройства.

По идее, если этот параметр растёт, значит, винчестер изнашивается. Но также это может говорить о недостаточном питании, как на постоянной основе, так и единожды, из-за скачка напряжения.

04 Number of Spin-Up Times (Start/Stop Count)

Показатель, сообщающий о количестве запусков шпинделя, то есть сколько раз запускался диск. Он может быть ненулевым даже у новых устройств, так как заводские проверочные запуски тоже учитываются.

Иногда у производителей, вроде Seagate, здесь отображается количество раз использования энергосберегающего режима.

05 Reallocated Sector Count

Здесь показано, сколько раз переназначались сектора и это один из важнейших пунктов.

Если со считыванием данных с сектора возникают проблемы, о сначала становится кандидатом на переназначение, а потом оказывается переназначен. С этого момента на него больше ничего не записывается, и ничего не читается, его роль исполняет резервный исправный сектор.

Так как подобная технология использовалась не всегда, у старых и новых винчестеров здесь по-разному вычисляются значения. У первых оно будет маленьким, но при этом количество бэд-блоков — велико. У новых всё наоборот.

Учитывайте, что резерв не бесконечен и оттуда не получится постоянно вытаскивать свежие сектора.

07 Seek Error Rate

Здесь говорится о том, как часто магнитные головки становятся не на свои места. Чем чаще эти нарушения дают о себе знать, тем хуже, ведь можно считать, что винчестер на грани поломки.

Однако, учитывайте, что увеличивать этот параметр может и излишне высокая температура устройства.

08 Seek Time Performance

Здесь говорится, насколько хорошо перемещаются магнитные головки. Чем медленнее они работают, тем медленнее читаются данные.

Неизвестно, в чём именно измеряется значение этого атрибута. Поэтому трудно предположить, насколько должно быть велико отклонение от первоначального значения, чтобы начать волноваться.

09 Power On Hours Count (Power-on Time)

Этот атрибут показывает, сколько времени ваш накопитель провёл во включённом состоянии в целом за свою жизнь. Здесь пороговым значением будет максимальное время выработки, установленное производителем. То есть его достижение не обязательно будет значить мгновенную смерть устройства, но отслеживать этот параметр стоит.

10 (0А) Spin Retry Count

Здесь показано количество повторных запусков шпинделя диска. Если шпиндели не запускаются, устройство автоматически пробует сделать это ещё раз, и эти попытки считаются.

Это может говорить о механических неполадках устройства, но может намекать и просто на недостаток питания. Если здесь значение больше 2–3, посмотрите на связь жёсткого диска с блоком питания, а уже потом подозревайте повреждение самого диска.

11 (0B) Calibration Retry Count (Recalibration Retries)

Этот показатель — количество попыток магнитных головок вернуться в изначальную позицию, если с первого раза не получилось встать правильно.

То есть чем чаще это происходит, тем чаще магнитные головки становятся неправильно, что говорит о вероятных неполадках с накопителем памяти.

12 (0C) Power Cycle Count

Здесь говорится, как часто диск проходил цикл «включение-выключение». Чем больше, тем хуже, конечно, но сложно понять, при каких значениях нужно задумываться о покупке нового устройства.

183 (B7) SATA Downshift Error Count

Иногда так случается, что накопитель памяти требует от SATA контроллера снижения скорости передачи данных. Причины у этого могут быть разные, и они необязательно серьёзные, просто какие-то случайные ошибки.

В этом атрибуте будет записано, сколько раз диск пытался заставить контроллер SATA сбросить скорость. Если значение покажется вам слишком большим, попробуйте заменить кабель SATA, это может сработать.

184 (B8) End-to-End Error

Этот атрибут связан с передачей данных через кэш жёсткого диска. Но у разных производителей винчестеров он значит немного разное.

Например, у HP здесь считаются моменты, когда зафиксировано несовпадение количества данных у источника и получателя. А у Kingston — количество возникновения ошибок, когда данные пытаются считать из флеш-памяти.

187 (BB) Reported Uncorrected Sector Count (UNC Error)

Показатель количества ошибок, связанных с чтением данных. Если эти проблемы не были исправлены инструментами самого винчестера, как раз это сюда и записывается. Значение здесь — количество секторов, претендующих на переназначение, если при следующем запуске опять возникнут проблемы чтения.

Обычно этот параметр учитывается в паре со 197.

188 (BC) Command Timeout

У винчестеров есть максимальное время, сколько они готовы ожидать отклика от получателя данных. Если время ожидания истекло, а связь так и не установилась, количество подобных событий записывается в этот атрибут.

Такие ошибки могут возникать из-за плохой связи между накопителем памяти и материнской платой, плохой связи с блоком питания, несовместимости винчестера и порта SATA. Также такая проблема может возникать из-за ошибок Windows.

189 (BD) High Fly Writes

Здесь — количество случаев, когда высота нахождения магнитной головки диска была выше, чем рассчитано системой. Такое случается по разным причинам, вроде вибраций или внутренних повреждений диска.

190 (BE) Airflow Temperature

Этот атрибут подскажет вам температуру внутри корпуса HDD или SSD. Но у разных производителей это значение рассчитывается по-разному.

Например, у Seagate нужно вычесть из 100 значение HDA, у Western Digital — вычесть его из 125. А у Hitachi, Samsung считать ничего не требуется.

191 (BF) G-Sensor Shock Count (Mechanical Shock)

Количество ударных нагрузок, которые фиксирует внутренний акселерометр.

Важно учитывать, что датчики у всех производителей разные, некоторые более чувствительные, некоторые — менее. Поэтому срабатывать датчики могут и при абсолютно безопасных колебаниях.

192 (С0) Power Off Retract Count (Emergency Retry Count)

Здесь говорится о количестве циклов включения/выключения устройства в аварийном режиме, например, из-за обрыва питания или из-за реакции «датчика падения».

У WD и Hitachi этот атрибут, как и №12, может показывать просто количество пройденных рабочих циклов устройства.

193 (С1) Load/Unload Cycle Count

Атрибут для обозначения количества циклов, при которых магнитные головки перемещаются в рабочее положение и возвращаются обратно. То есть количество успешных рабочих запусков.

194 (С2) Temperature (HDA Temperature, HDD Temperature)

Здесь показывают текущую, а также наименьшую и наибольшую температуры винчестера. Так как внутри накопителей памяти всегда есть температурные датчики, значения здесь можно считать достаточно точными.

Если у вас SSD, то здесь будет показана температура внутри корпуса. Так вы сможете следить, не слишком ли перегреваются ваши устройства, хватает ли им охлаждения.

195 (С3) Hardware ECC Recovered

Атрибут, говорящий, сколько ошибок было решено средствами ECC. Значение здесь иногда повышается и из-за разгонов системной шины, контроллер SATA к этому чувствителен.

196 (С4) Reallocated Event Count

Здесь показано, сколько раз система инициировала переназначение секторов. Чем больше значение, тем хуже, хотя здесь показатели растут, даже если переназначения прошли без проблем.

Рассматривайте атрибут в паре с №05, потому что часто они растут одновременно.

197 (С5) Current Pending Sector Count

В этом атрибуте вы увидите, сколько зафиксировано потенциально повреждённых секторов. Они не обязательно испорченные, но со считыванием данных с них возникли трудности.

Если в следующий раз сектор прочтётся, как должен, он будет исключён из списка, если ошибки повторятся — окажется переназначен.

198 (С6) Offline Uncorrectable Sector Count (Uncorrectable Sector Count)

Число секторов диска, недоступных для восстановления. Если число таких критических дефектов стремительно растёт, значит диск совсем скоро может выйти из строя.

199 (С7) UltraDMA CRC Error Count

Обычно этот атрибут говорит о проблемах со шлейфом, соединяющим жёсткий диск с остальной системой ПК. Он может быть иметь повреждения или просто быть перекрученным и мятым, могли испортиться контакты.

Значение здесь растёт также при разгонах шины PCI, проблемах с питанием устройства, иногда даже из-за конфликта драйверов.

В общем, попробуйте заменить или привести в порядок кабель, соединяющий винчестер с системной платой и блоком питания, а потом проверяйте всё остальное.

200 (С8) Write Error Rate (MultiZone Error Rate)

Этот показатель подскажет вам, сколько раз система сталкивалась с ошибками чтения данных на накопителе памяти.

Если число этих ошибок велико и быстро растёт, легко сделать вывод, что устройство уже близко к окончанию своего срока службы.

201 (С9) Soft Read Error Rate

Здесь говорится о том, сколько раз ошибки чтения появлялись из-за проблем с ПО, которое инициирует чтение, а не из-за повреждений самого накопителя памяти.

Если у вас SSD, а не HDD, то здесь будет показано, сколько ошибок чтения исправлена сторонними методами, а не ECC.

202 (СА) Data Address Mark Error

У этого параметра обычно нет какого-то понятного описания. Он информационный, и значения здесь зависят от производителя накопителя.

Но обычно говорят, что он не содержит ничего такого, что намекнуло бы вам на срок жизни проверяемого устройства.

203 (CB) Run Out Cancel

Здесь говорится о количестве ошибок ECC. Не уточняется, исправлены они или нет, просто говорится о том, сколько зафиксировано за время использования винчестера.

220 (DC) Disk Shift

Значение здесь в неизвестных единицах, но оно показывает, насколько блок дисков смещён по отношению к шпинделю.

По идее, смещения вообще быть не должно и появляется оно обычно из-за механического повреждения диска.

240 (F0) Head Flying Hours

Здесь показано в часах, сколько времени работал блок магнитных головок.

Можно предположить, что чем больше времени, тем хуже, но вообще, это довольно спорно. Так что учитываете этот параметр по своему желанию.

254 (FE) Free Fall Event Count

Это интересный параметр, наверное, самый интересный из всех. Free Fall в названии переводится как «Свободное падение», и именно это и означает. Здесь будет показано, сколько раз падало ваше устройство, если у него есть внутри датчики определяющие нормальное и ненормальное поведение в пространстве. Похожий параметр был и раньше, 191, но тогда учитывались все аномальные движения, а здесь — только падения.

Мы рассмотрели все необходимые параметры SMART с расшифровками, так что теперь можете использовать этот материал в момент сканирования диска, чтобы принять решение о необходимости лечения. Вы сможете сделать это как теми же самыми программами, вроде Victoria, так и более сложным софтом, по типу HDD Regenerator.

P. S. Установка на MacOS smartctl через brew

Откройте Терминал и выполните следующую команду для установки smartmontools с помощью Homebrew:

brew install smartmontools

Чтобы узнать номер диска, выполните следующую команду:

diskutil list

Следующая команда получает состояние SMART для указанного диска:

smartctl -a diskX (X – номер диска)

Это даст подробный отчет SMART в стандартном выводе. Если вы хотите сохранить отчет SMART на диск, вы можете отправить его в текстовый файл с управляющим символом & gt:

smartctl -a diskX & gt, diskhealthreport.txt

Полезности Приложения