http://ITWare.com.ua/news/15488/

23 марта 2007 г

MTBF не отражает реальной картины работоспособности HDD?

Ученые Университета Карнеги Меллоун заявили о том, что производители жестких дисков, возможно, преувеличивают показатели времени работы на отказ (MTBF) своих HDD. Исследователи университета отмечают, что в среднем ошибки наступают в 15 раз чаще, чем сообщается в данных производителей.

Собрав информацию о примерно 100 тыс. жестких дисках всех производителей, исследователи Карнеги протестировали приводы в различных условиях работы, а также в сценариях «реального мира». Некоторые приводы находились у поставщиков услуг Интернет, другие – в центрах обработки данных или же в исследовательских лабораториях. Согласно полученным результатам тестирования, большинство дисков в минимальной степени подвержены условиям окружающей среды. В общем и целом исследователи сделали вывод о том, что температура не оказывает никакого влияния на показатель возможности возникновения ошибки – холодные приводы не работали дольше горячего.
В тестах принимали участие приводы различных типов – Serial ATA, SCSI и даже топовые диски для fiber-channel (FC). Обычно пользователи платят за премиум-приводы типа SCSI или FC намного дороже, что обычно означает более длительный срок гарантии и более высокий показатель MTBF. Однако исследователи Карнеги не считают, что такие топовые приводы в чем-либо обгоняют своих «обычных» собратьев. Согласно собранной ими информации, показатели замены для дисков SATA были не хуже, чем для приводов SCSI или FC. Это, отмечается в отчете, может свидетельствовать о том, что не связанные с диском факторы, такие как условия работы, степень использования или внешняя среда, влияют на вероятность поломки больше, чем факторы компонентов.
Согласно итогам исследования, «номером один» среди причин поломки приводов был возраст. Чем дольше HDD работает, тем больше он подвержен вероятности поломки. По словам авторов, приводы начинают подавать некоторые признаки скорого наступления «кризиса» примерно через пять-семь лет работы, вслед за чем резко увеличивается показатель среднего возникновения поломки (AFR). Примечательно также, что вероятность поломки в первый год работы и ранее также высока, как и после семи лет.
Ученые из Карнеги считают «сильно завышенными» производителями показатели MTBF. К примеру, для семейства Seagate Cheetah X15 показатель MTBF равен 1,5 млн часов – то есть, свыше 171 года непрерывной работы до возникновения проблемы. Однако исследователи Карнеги считают, что потребителям следует руководствоваться более реальными 9-11 годами. При этом в условиях «реального мира» данные показывают в среднем шестилетний срок до возникновения поломки.
Средний показатель замены приводов колеблется в пределах от приемлемых 2 % до неприятно удививших 13 %. Это, иронизируют исследователи, четко показывает, что производителями следует поменять методику генерирования показателя MTBF. Хуже всего то, что самыми высокими показателями замены были у приводов с MTBF от 1 до 1,5 млн часов.
По словам Гарта Гибсона (Garth Gibson), профессора Карнеги, итоги исследования показали, что MTBF не может являться достоверным показателем качества привода. Мы не получили доказательств того, что диски SATA менее надежны, чем SCSI или Fiber Channel.
Исследователи Карнеги уверены, что для работы с критически важными данными очень важна возможность запасного копирования информации, безотносительно типа используемого жесткого диска. Примечательно в этой связи, говорится в отчете, что даже в центрах обработки данных Google применяются главным образом диски SATA и PATA. Всего лишь вопрос времени, считают ученые, прежде чем SATA-диски покажут себя равными или лучше, чем SCSI и FC приводы, предлагая ту же работоспособность за гораздо меньшую цену.