Перейти к публикации
СофтФорум - всё о компьютерах и не только
Cameroon

FAQ - по S.M.A.R.T

Рекомендованные сообщения

i

Уведомление:
Общие вопросы по жестким дискам обсуждаются в этой теме.
Там же вы можете найти ряд программ для работы с жесткими дисками.


Что такое S.M.A.R.T.?
- Self-Monitoring, Analysis and Reporting Technology - технология оценки состояния жёсткого диска системой интегрированной аппаратной самодиагностики/самонаблюдения. Основная задача - определить вероятность выхода устройства из строя, предотвратив потерю данных.

Почему показания S.M.A.R.T. жестких дисков различных вендоров (производителей) отличаются?
- Потому что технология развивалась поэтапно, и внедрялась отдельно каждым производителем по-своему: сначала IBM с технологией PFA (Predictive Failure Analysis), потом Compaq с IntelliSafe, затем по инициативе Compaq, компаниями IBM, Seagate, Quantum, Conner и Western Digital было создано стандартизованное подобие нынешнего S.M.A.R.T. симбиозом IntelliSafe и PFA.
- Стандарт SMART I предполагал мониторинг основных параметров и запускался только после команды по интерфейсу.
- Созданию стандарта SMART II способствовали инновации компании Hitachi: методика полной самодиагностики накопителя (Extended Self-Test) и журналирование ошибок.
- Стандарт SMART III обеспечил прозрачное наблюдение за состоянием диска с функцией обнаружения дефектов поверхности и возможностью их восстановления.
- Современные атрибуты S.M.A.R.T. могут различаться для каждого отдельно взятого диска.

Каким образом можно получить показания S.M.A.R.T.?
- С помощью специализированного софта:
-- HDTune (вкладка Health/Здоровье)
-- Victoria (Документация)
-- CrystalDiskInfo
-- Advanced SmartCheck
-- Hard Disk Sentinel
--- Фирменные утилиты SeaGate
--- Фирменные утилиты Samsung
--- Фирменные утилиты Hitachi
--- Фирменные утилиты WD
---- Caviar Green/GP
---- Caviar Blue/SE/SE16 (SATA II)
---- Caviar Black
---- RE3
---- RE4

Что такое система само-тестирования (само-диагностики) диска?
- Иногда диск производит самопроверку, поэтому не пугайтесь, если заметите, что в тот момент, когда никаких интенсивных операций в системе не проходит, а диск на некоторое время начинает интенсивно трещать. Такие операции часто запускаются в том случае, если у вас имеются "pending сектора". Диск сам начнет (в момент минимальной нагрузки) перепроверять "кандидата", для того, чтобы исключить его из списка подозрения, либо наоборот исключить из относительной индексации.
- Документировано существует три типа тестов само-диагностики:
-- Фоновый сбор данных (Off-line collection);
-- Сокращенный тест (Short Self-test);
-- Расширенный тест (Extended Self-test).
- Два последних способны выполняться как в автономном (off-line), так и в монопольном (on-line) режимах. Продолжительность их выполнения может длиться от нескольких секунд до минут и даже часов.
- Во время автономного тестирования возможно выполнение других команд, так как тестирование происходит в фоновом режиме. Во время монопольного режима тестирования выполнение других команд невозможно. Попытка исполнить другую команду приведет к прерыванию теста.
- Типичная задача само-тестирования - избавиться от "бэдов". Нужно заметить, что "релоки" могут быть (почти гарантированно) на диске сразу после его покупки "с нуля". Они будут находится в заводской резервной зоне (Primary list). Уже при непосредственной эксплуатации будет формироваться вторичный резерв (Growth list).
- Заметьте, "ремап" не может происходить до бесконечности, потому как объем пользовательской резервной зоны ограничен. Поэтому не удивляйтесь, если вдруг ваш "умирающий" диск (если вы по показаниям смарта заранее это определили) вдруг резко перестанет работать, хотя до этого вроде как худо-бедно трудился - он сам до отказа заполнит резерв "релоками", после чего уже не будет производить "ремап", и вы начнете терять данные. В том случае, если на "бэд-сектор" системного диска попадет системный файл, вы рискуете полюбоваться "синькой" (Blue Screen Of Death), с последующей невозможностью загрузки системы.

Атрибуты S.M.A.R.T.
- Это характеристики, использующиеся при анализе состояния надежности накопителя.

Значения атрибутов S.M.A.R.T.
- Столбцы:
-- Value/Current - текущее значение (в диапазоне от 0/1 до 100/200/255) - надежность конкретного атрибута относительно его эталонного значения, которое определяется производителем.
---Максимальное значение атрибута означает максимальную стабильность. Чем значение ниже, тем быстрее текущий параметр деградирует.
-- Worst - означает наихудшее из всех когда-либо запротоколированных значений, т.е. наихудшее (бывшее) состояние атрибута.
-- Threshold - пороговое значение для каждого отдельно взятого атрибута.
---Если текущее значение атрибута ниже, чем пороговое, значит вероятность отказа (если этот параметр критичен) велика.
-- Raw - значение атрибута во внутреннем формате. Иногда значения могут нести бесполезную нагрузку, гораздо важнее, что из них вычисляется преобразованное значение.
-- Data - преобразованное значение атрибута, в большинстве случаев говорящее о состоянии параметра в доступной для восприятия форме.

- Строки:
Основные критические (непосредственно влияющие на надежность работы диска) атрибуты:
-- Raw Read Error Rate - частота ошибок при чтении данных с поверхности диска. Возникает в случае, когда при единовременном проходе, головке не удается произвести чтение ячейки. Увеличение параметра вызвано обычно аппаратными неполадками.
-- Soft Read Error Rate - частота появления "программных" ошибок при чтении данных с диска. В данном случае виновата не аппаратная часть, а логическая (ошибка микропрограммы диска).
-- Write Error Rate - частота появления ошибок записи. Вызвана в большинстве своем неполадками механики.
-- Seek Error Rate - ошибки позиционирования головки. Вызваны неполадками движущей механики, либо повреждением "сервометок" (servo)из-за сильного термического расширения дисков или "промахом" самой головки.
--- Магнитная головка знает в какое положение относительно дорожки диска ей необходимо закрепиться (сверяя свое положение по сервометкам) для того, чтобы попасть туда, куда нужно и считать запрашиваемую информацию с определенного адреса, и если ее местоположение не совпадает с реальной позицией над запрашиваемой дорожкой, то возникает ошибка позиционирования.
-- End-to-End error - ошибка четности при передаче данных между кэшем и хостом.
-- Reported Uncorrectable Errors - ошибки, которые не удается исправить методами аппаратной коррекции.
-- Current Pending Sector Count - при единовременном проходе у головки может не получиться считать данные с ячейки, в таком случае эта ячейка будет помечена "кандидатом на замену". Параметр этот может меняться, потому как неудача иногда возникает по вине самой головки (когда она виновата в том, что "промахнулась") хотя ячейка при этом исправна. При повторном проходе статус может быть снят, в том случае, если чтение удалось осуществить успешно. Если этот параметр всегда нулевой, это может говорить о том, что качество само-тестирования на низком уровне.
-- Reallocated Sectors Count - количество "переназначенных секторов" (remap). Если магнитной головке жесткого диска не удается при нескольких проходах произвести чтение/запись/верификацию ячейки, микропрограмма попытается переместить данные в резервную область диска (spare area - она не входит в область основной разметки) и, в случае успеха, помечает сектор как "переназначенный", т.е. при каждом запросе на чтение данных из этой ячейки, будет происходить "перенаправление" (redirect) на ее резерв, следовательно физически этот переназначенный сектор больше не будет использоваться.
--- Благодаря "ремапу", на современных жестких дисках очень редко видны (при тестировании поверхности) "битые сектора" (bad block). Если на графике чтения с поверхности будут заметны "провалы" - резкое падение скорости чтения (до 10% и более), значит вероятны 2 варианта:
---- В этот момент к диску поступило обращение сторонней команды (например, системы);
---- На нем слишком много "ремапов", и головке приходится скакать туда-сюда по поверхности диска из основной разметки в резервную.
-- Reallocation Event Count - количество попыток "ремапа". В поле атрибута (raw value) хранится общее число попыток (как успешные, так и безуспешные) переноса информации с переназначенных секторов в резервную область.
-- Spin Up Retry Count - число повторных попыток раскрутки шпинделя до рабочей скорости. Возрастание значения говорит о том, что диски по той или иной причине не получилось вывести на расчетную скорость вращения с первой попытки. Ошибки обычно вызваны аппаратными проблемами.
-- Recalibration Retries - количество повторов попыток рекалибровки. Неполадки механики иногда приводят к тому, что диску приходится сбросить состояние позиционирования головки в нулевую дорожку. Значения этого атрибута засчитывается в том случае, если рекалибровка происходила большее количество раз, чем положено.
-- Read Error Retry Rate - количество повторных операций чтения ячейки. Возрастание параметра атрибута может говорить как о проблемах поверхности диска, так и некорректном функцмонировании считывающей головки.
-- Soft ECC correction - количество ошибок ECC (Error-Correcting Code - код коррекции ошибок), удачно скорректированных программным способом.
-- Power-off Retract Count - количество операций вывода блока магнитных головок из рабочей зоны в парковочную, результатом которых послужил перебой питания диска.
-- Run Out Cancel - количество операций коррекции данных из-за неправильной хэш-суммы.
-- Hardware ECC Recovered - число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по интерфейсу).
-- Uncorrectable Sector Count - если обычно после ошибки чтения микропрограмма пытается исправить положение дел, то этот параметр показывает те случаи, когда коррекцию произвести не удалось. Чаще всего причина кроется в критической неисправности механики/аппаратной части, либо при наличии софт-бэда.
-- UltraDMA CRC Error Count - количество ошибок CRC (контроль целостности передачи данных) при обмене данными между диском и контроллером в режиме UltraDMA по контрольной сумме.
--- Ошибка может возникать в нескольких случаях:
---- При сильном завышении частоты PCI (больше номинальных 33.3 MHz);
---- При надломленном или сильно закрученном кабеле;
---- При ошибке драйверов ОС (при чем не только драйверов жесткого диска);
---- При сбое в работе (например, при внезапном скачке напряжения или отключения питания компьютера), когда посланные диском пакеты не доходят до контроллера.
-- Command Timeout - количество операций, отмененных по превышении предела ожидания. Возникают такие ошибки обычно при неисправном кабеле или сбоях в подаче питания.
-- High Fly Writes - количество операций записи произведенных при положении магнитной головки выше номинального значения (head flying range).
-- Disk Shift - дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
-- G-Sense Error Rate - атрибут хранит показания ударо-чувствительного сенсора - общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, толчке, излишней вибрации, неправильной установке, и т.п.).

Некритические атрибуты, сообщающие служебную информацию, не оказывающую прямого влияния на надежность диска.
-- Throughput Performance - средняя производительность диска по оценки программы само-диагностики. Регламентируется производителем.
-- Seek Time Performance - средняя производительность операции позиционирования магнитными головками. Аппаратно зависимый параметр.
-- Spin Up Time - время, затрачиваемое шпиндлем для того, чтобы выйти на расчетную скорость вращения. Ухудшение значение атрибута указывает на проблемы с приводом или подшипником.
-- Start/Stop Count - количество зафиксированных циклов запуска/остановки шпинделя.
-- Power-On Time Count - общее количество часов в рабочем состоянии. Значение зависит от отдельно взятого диска/производителя.
-- Power On/Off Retract Cycle - количество зафиксированных циклов полного включения/отключения.
-- Load/Unload Cycle Count - количество операция вывода блока магнитных головок в или из рабочей зоны.
-- Head Flying Hours - общее время, затраченное на позиционирование БМГ.


Пример показаний S.M.A.R.T. исправного диска:

8921aa84145a.png
5a847b3f4547.jpg


Пример показаний S.M.A.R.T. неисправного диска:

При включении компьютера после POST'а вы увидите предупреждение "S.M.A.R.T. status BAD":
5bebded440b8.png
49d4a3355d02.jpg



Что такое "бэды"?
- "Бэды" (bad block) - это ячейки диска, непригодные для хранения информации.
-- "Аппаратные бэды" - аппаратно неисправная область поверхности диска, которую никак не исправить кроме извлечения из относительной адресации (remap);
-- "Софтовые бэды" ("софт-бэд") - ячейки, которые невозможно использовать из-за неисправностей логического характера. "Лечатся" программой "erase": магнитная головка заполняет область диска нулями, уничтожая таким образом и данные в ячейках, и неисправности.

Изменено пользователем Cameroon
  • Upvote 6

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Дополнение:

Атрибуты у разных производителей зачастую трактуются по-разному!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Cameroon

Это плохо, то что выделено жёлтым? Или ничего страшного?

post-92297-062487900 1288341460_thumb.jp

Что вообще значит жёлтая пометка?

post-92297-062487900 1288341460_thumb.jp

Изменено пользователем Taymer

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Taymer,

Следи, чтобы он не рос.

И покажи смарт из hddscan еще.

Изменено пользователем Wu-Tang

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Taymer,

Следи за 5, как я и сказал, и за 187, 199 не растет?

Естественно следить надо за raw!

Изменено пользователем Wu-Tang
  • Upvote 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
199 не растет?

Не знаю, я только сегодня заинтересовался этим вопросом :blush2:

Буду смотреть. Спасибо за советы :rolleyes:

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня два харда MAXTOR RTM3500320AS (500gB)буква "G" и ST31000528AS (1Tb) разбит на два "C" 50 Gb (стоит винда) и "Z" 881,51 Gb.

Винда Win XP SP3

При запуске Chkdsk /g на доли секунды вылетает окно и быстро исчезает.

Сканирование memtest-ом без ошибок

HD Tune Pro показывает в кладке Health по MAXTOR RTM3500320AS:

........................................ Current Worst Threshold Data Status

(0A)Spin Retry Count......... 100...... 99..... 97........... 67... warning

(C5)Current Pending Sector 100...... 100... 0............. 5..... warning

по ST31000528AS:

......................................... Current Worst Threshold Data Status

(05)Reallocated sector Count 92...... 92...... 36.......... 329.. warning

начало тут

Что с ними жить будут?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Добрый день!

Нарисовалась проблема с жестким WDC WD10EADS-00M2B0 (1000 GB).

Используется как хранилище файлов для торрента.

При копировании больших файлов начал пропадать из системы.

После перезагрузки вновь появлялся в системе.

Освободил на четверть место и кое-как дефрагментировал диск DEFRAGGLERом

за несколько попыток.

Протестил HD Tune: полное сканирование выявило 4 поврежденных сектора.

HDD не перегревался, не ронялся. Несколько раз за 1,5 года пропадало электричество.

Заодно прошу оценить второй HDD (500 GB)с системой (WDC WD6400AAKS-22A7B (640 GB).

Эксплуатировался в тех же условиях 2 года. Поврежденных секторов не выявлено.

Спасибо

i

Уведомление:

Как и просили, сообщения из этой темы удалил.

2011 01 27_Error Scan_1TB_15.23.JPG

2011 01 26_Benchmark_1TB_18.02.JPG

2011 01 26_SMART_1TB_18.02.JPG

2011 01 26_SMART_500GB_18.06.JPG

post-101378-0-67050900-1296150915_thumb.

post-101378-0-59306800-1296151015_thumb.

post-101378-0-48674400-1296151147_thumb.

post-101378-0-71134400-1296151183_thumb.

Изменено пользователем Yezhishe

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@fish60, с WD10EADS состояние плачевное.

ему как минимум нужно прогнать скан поверхности с ремапом из-под ДОС. хотя как хранилище важных данных использовать уже не рекомендуется.

WD6400AAKS в полном порядке.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Cameroon Спасибо!

Так примерно и предполагал.

А после ремапа, если эти секора останутся, вырезать как-нибудь их не получиться?

Они вроде как в конце диска.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

после ремапа они и так будут вырезаны.

если атрибуты после этого рати не будут, значит юзать диск дальше можно, но обязательно прикрываться бэкапами. если железка дала сбой один раз, скорее всего когда-нибудь это повторит.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Гляньте, плз, смарт.

Reallocation Event Count желтым выделено. Читал описание. Но не понимаю, что значит "количество попыток "ремапа". В поле атрибута (raw value) хранится общее число попыток (как успешные, так и безуспешные) переноса информации с переназначенных секторов в резервную область."

Т.е. непонятно, значение 100 - это хорошо, или плохо? В описании написано, что "Value/Current - текущее значение (в диапазоне от 0/1 до 100/200/255) ", и чем выше значение, тем лучше.

Но я вот не знаю, какое максимальное значение для этого параметра должно быть - 200,255, или 100? Если максимальное значение 255, то значит у меня (значение 100) все плохо. Если максимальное значение 100, то почему у меня оно выделено желтым?

Да и по остальным параметрам такие же вопросы, хотя желтым не выделено.

Спасибо.

Безымянный.JPG

post-55266-0-20893800-1309678882_thumb.j

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Гляньте, плз, смарт.

Reallocation Event Count желтым выделено. Читал описание. Но не понимаю, что значит "количество попыток "ремапа". В поле атрибута (raw value) хранится общее число попыток (как успешные, так и безуспешные) переноса информации с переназначенных секторов в резервную область."

Т.е. непонятно, значение 100 - это хорошо, или плохо? В описании написано, что "Value/Current - текущее значение (в диапазоне от 0/1 до 100/200/255) ", и чем выше значение, тем лучше.

Но я вот не знаю, какое максимальное значение для этого параметра должно быть - 200,255, или 100? Если максимальное значение 255, то значит у меня (значение 100) все плохо. Если максимальное значение 100, то почему у меня оно выделено желтым?

Да и по остальным параметрам такие же вопросы, хотя желтым не выделено.

Спасибо.

Не обращайте внимание, используйте винт как и использовали. Через мои руки тысячи хардов прошли, в больше чем половине из которых жизненные показатели (исходя из показаний) были ниже плинтуса, и ничего работали по 10 лет к ряду. У иных - наборот, показатели пестрили зеленым, а устройства дохли на второй неделе использования. S.M.A.R.T (ИМХО) - совершенно пустотелая программа для даунов!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

День Добрый! Помогите с расшифровкой SMART плиз ...

Ситуация такова: Samsung 500 Гб (разделы C, D, E) и WD 1Тб (разделы L, M); на C живет Win 7 и куча софта.

С начала недели при загрузке хард стал подшоркивать, подскреживать - вобщем не глобально, но раньше такого не было. Ближе к середине - звуки стали заметней =( Винда стала долго грузиться, а на картинке зависать на 5 минут. Запустил фрагментацию ... все по 0, кроме С - там 8%. Дефрагментировал.

Теперь Винда также долго грузится, также висит на картинке, но висят теперь все программки - особенно волнует Шоп. Причем процессы запускаются - их видно в Диспетчере. Запуск chkdsk c:/ ничем не помог =((

ХЭЛП!!! А может вообще не винт???????? Спс!!!

Безымянный хард-2.jpg

Безымянный хард.jpg

post-106925-0-77100000-1310138999_thumb.

post-106925-0-35649600-1310139012_thumb.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вентиляторы на корзинке для винтов установлены? Следует банальный перегрев.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если верить показаниям, что на скриншоте, то во-первых - слишком высока температура винчестера. Отсюда - ошибки чтения\записи, отсюда же и появление нечитаемых блоков, которые логика винчестера перемещает в служебную область (Reallocate), отсюда же (второй скриншот) - и неисправляемые (uncorrectable) ошибки.

Если нет желания окончательно загубить винчестер(ы) - поменяйте корпус, чтобы было нормальное охлаждение винчестеров и прочего. Либо поставьте вентилятор на морду корпуса (изнутри, натурально), чтобы всасывал забортный воздух и хоть как-то охлаждал HDD.

В противном случае, неприятности пойдут по нарастающей вплоть до физической гибели винчестеров.

P.S. Сейчас ещё (при нормальном охлаждении) - можно попытаться с помощью программы Victoria сделать принудительный ремап дурных секторов и хоть как-то привести винт в сознание.. (потребуется полный бэкап всего, что есть на винчестере)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не обращайте внимание, используйте винт как и использовали. Через мои руки тысячи хардов прошли, в больше чем половине из которых жизненные показатели (исходя из показаний) были ниже плинтуса, и ничего работали по 10 лет к ряду. У иных - наборот, показатели пестрили зеленым, а устройства дохли на второй неделе использования. S.M.A.R.T (ИМХО) - совершенно пустотелая программа для даунов!

Спасибо, конечно, но интересует не только Ваш жизненный опыт, но и конкретная оценка состояния винта по приложенному СМАРТу. Ну и здорово было бы получить ответы на мои вопросы. Извините, если что не так!, но очень важно понимать, на каком я свете: "жизненные показатели (исходя из показаний) ниже плинтуса", или все ок?

Изменено пользователем 699622

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот будут красным помечены определенные области, тогда можно бить конкретную тревогу, а так..., говорю же - работает винт так и хай себе работает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

×