SSD-накопители: надежность и управление сроком службы

Логотип компании
SSD-накопители: надежность и управление сроком службы
С течением времени производительность SSD-накопителей постепенно падает. Для повышения надежности и срока службы SSD-накопителей, производители предлагают применять различные технологии.Расскажем, как увеличить срок эксплуатации столь полезных устройств.

Карты памяти, USB-флэшки, твердотельные (SSD) накопители — все эти устройства объединяет то, что в их основе применяется флэш-память NAND. Их можно встретить в мобильных телефонах, компьютерах, ноутбуках, СХД, различных гаджетах — словом, повсюду. По скорости доступа к сохраненным данным и производительности они значительно превосходят жесткие диски. Как альтернативу для них часто рассматривают облачные хранилища, обеспечивающие такое же удобство в применении. Тем не менее пока приоритет пока остается у флэш-памяти — явного фаворита, особенно когда имеются повышенные требования к доступности данных или быстродействию.

Кажется, что технология отработана на все 100% (это действительно правда). Надежность при хранении данных может пострадать только в случае форс-мажорных угроз, например, при попадании под пресс или в результате воздействия агрессивных сред.

Но хотя вендоры любят повторять, что проблема деградации хранения данных, выявленная на заре внедрения флэш-устройств, сегодня уже не актуальна, вопросы, касающиеся долговечности и надежности хранения данных на флэш-носителях, до сих пор остаются.

Далее мы расскажем об этом более подробно, а также приведем рекомендации, которые позволят увеличить срок эксплуатации столь полезных устройств.

Флэш изнутри

Флэш состоит из следующих элементов: микросхемы памяти NAND, чипа контроллера, таймера, интерфейсного разъема и корпуса (если это отдельное устройство). Сама NAND-память представляет собой матрицу из крошечных MOSFET-транзисторов. Их количество определяет, какой емкостью обладает флэш-память.

Задача транзисторов состоит в выполнении одной простой операции: «протолкнуть» электроны через оксидный барьер в полупроводниковый «затвор», чтобы создать там заряд (состояние «1») или сбросить его (состояние «0»). Благодаря простоте, флэш-накопители отличаются надежностью и высоким быстродействием.

Для сравнения: жесткие диски обладают значительно более сложной конструкцией. Внутри даже портативных HD присутствуют вращающиеся диски. Для записи и считывания данных требуется подвод внешнего питания. Любая тряска передается на подвижные головки, поэтому работать с HD в дорожных условиях — всегда риск. А сегодня мобильность — одна из главных черт, присущих каждому пользователю.

Высокая производительность твердотельных SSD-накопителей достигается за счет распараллеливания выполняемых операций. Благодаря такой схеме работы обеспечивается более высокая скорость при обращении к данным, высокая энергоэффективность, сопротивляемость неблагоприятным факторам, компактный размер. В результате сегодня SSD более долговечны по сравнению с другими вариантами хранения.

Как долго может работать SSD-устройство?

Несмотря на все достоинства, и у флэш-накопителей есть ограничения. Главная проблема — постепенная деградация применяемого «запорного» механизма.

Со временем снижение надежности работы энергонезависимой памяти происходит из-за того, что постепенно запорный транзистор теряет способность надежно удерживать заряд. С точки зрения пользователя это выражается в том, что на твердотельные накопители устанавливают гарантийный срок службы, который, по сути, определяется тем, какое количество перезаписи в ячейках допустимо при стабильно высокой надежности хранения данных.

Речь не идет о 100%-ном отсутствии ошибок при работе SSD. Используя специальную логику, разработчики научились сохранять работоспособность микросхем памяти за счет перераспределения ячеек хранения и вывода из эксплуатации сбойных элементов. Аналогичный эффект наблюдается и для жестких дисков, где появление сбоев нивелируется высвобождением соответствующих дорожек из процесса повторной записи.

Главный вопрос: как в условиях реальной эксплуатации избегать проблем потери данных? Для этого необходимо понимать, как оценивается долговечность дисков и когда надо принимать решение об их замене.

Параметры оценки долговечности SSD

Надежность твердотельного накопителя оценивают чаще всего по следующим параметрам: TBW (Terabytes Written) — суммарное количество терабайт, записанных на протяжении всего гарантированного срока эксплуатации накопителя; DWPD (Drive Writes Per Day) — средний ресурс записи в день.

При выборе SSD-диска чаще всего обращают внимание на параметр TBW (указан в спецификации). Он определяет гарантированный объем данных, которые можно надежно записать на устройство. Выход за пределы этого значения повышает риск существенного ускорения процесса деградации ячеек памяти. Типовое значение TBW составляет от 60–70 (для младших моделей) до 350–400 (для высококачественных изделий).

Если говорить по сути, то, конечно, прямой зависимости надежности флэш-накопителя от количества записанных на него терабайт нет — можно записывать гораздо больше. Но необходимо учитывать важную особенность.

Дело в том, что запись на флэш-накопители хотя и происходит в ячейки памяти, но управляется на уровне блоков ячеек. Такой алгоритм повышает производительность и позволяет более эффективно перераспределять записанные данные для достижения более равномерного износа ячеек. Но в результате, в частности при удалении данных, оставшаяся их часть в блоке переносится автоматически на новое место. Поэтому пользователям не следует опасаться записи крупных по размеру данных на флэш-накопители. Основной «износ» возникает в первую очередь из-за записи большого количества мелких файлов.

На практике применяется и другой параметр — DWPD. Он оценивает, сколько раз в течение одного рабочего дня можно полностью перезаписать весь объем диска на протяжении всего гарантийного срока. Как это используется, расскажем ниже.

Рекомендации по выбору SSD-диска

Учет параметра TBW помогает правильно подбирать нужную конфигурацию SSD-диска для компьютера. Даже если работа связана только с просмотром Интернета, в современных ОС широко представлены различные механизмы работы с памятью и устройствами хранения, которые неизбежно ведут к многократной перезаписи данных, даже если пользователь не записывает их вручную.

Возьмем, например, механизм гибернации, то есть процесса сброса на SSD-накопитель части оперативной памяти, которая в текущей момент не используется для работы. Это делается для переноса в ОЗУ дополнительных данных, необходимых для выполнения текущих операций. Подобные фоновые процессы реализуются автоматически и могут отличаться высокой интенсивностью, если наблюдается недостаток размера ОЗУ под решаемые задачи. Частая перезапись данных на SSD-устройстве ускоряет износ этого ресурса.

Перейдем к DWPD. Если он равен 1, это означает, что в течение дня можно спокойно переносить в него данные, равные по объему размеру самого SSD-накопителя. Когда вендор SSD указывал этот параметр в спецификации, он имел в виду, что такая производительность SSD-диска в течение гарантийного срока его службы обеспечивает высокую уверенность в отсутствии проблем при эксплуатации.

Очевидно, что выбранная схема оценки очень условна. Но используя параметр DWPD, удобно подбирать размер SSD-накопителя, зная, какая от него потребуется производительность в течение рабочего дня.

Как на практике пользоваться этими параметрами?

Возьмем для примера SSD, для которого производитель задал TBW равным 1000 Тбайт записи при 5-летнем сроке гарантий. Рассчитаем DWPD для двух накопителей с емкостью 200 и 400 Гбайт:

  • 200 Гбайт: (1000 Тбайт × 1000) ÷ (5 лет × 365 дней в году × 200 Гбайт) = 2740

  • 400 Гбайт: (1000 Тбайт × 1000) ÷ (5 лет × 365 дней в году × 400 Гбайт) = 1370

Рис. Формула для расчета параметра DWPD (источник: Kingston)

SSD-накопители: надежность и управление сроком службы. Рис. 1

Нужно дать ответ на вопрос: какой SSD-диск следует выбрать?

Видно, что при бóльшем объеме (400 Гбайт) и одинаковой общей «выносливости» (1000 TBW) ресурс ежедневной нагрузки для этого, более крупного диска вдвое меньше! (Хотя обычно считают, что «чем больше, тем лучше!) Также видно, что равноценная выносливость 1000 TBW достигается за счет большей емкости, и это позволяет снизить ежедневную нагрузку от перезаписи данных (в расчете на каждую ячейку).

Используя эти свойства, можно выбрать предпочтительный SSD-накопитель, оптимальный для конкретных, известных пользователю условий работы.

Рекомендации Microsoft по выбору SSD-дисков для серверов

Очевидно, что давать какие-либо общие рекомендации по выбору SSD-дисков для настольных и мобильных систем достаточно сложно. Таким выбором обычно занимаются вендоры компьютеров. Насколько точно им удалось «попасть» в целевую аудиторию, насколько рациональный выбор они сделали с учетом цены, производительности и надежности — это то «ноу-хау», которое есть у каждого производителя.

Почему это важно знать именно сейчас? В настоящее время в России нарастают темпы выпуска отечественных моделей компьютеров в рамках импортозамещения. В этом процессе есть немало подводных камней, и российским вендорам необходимо обращать внимание на такие подробности.

Что касается рекомендаций, то, например, Microsoft публикует свои советы и регулярно обновляет их. Особенность ее выбора комплектующих связана только с тем, что публикуются рекомендации для оснащения серверных систем, работающих под управлением Azure Stack HCI (v. 22H2 и 21H2), Windows Server 2022 и Windows Server 2019. Согласно этим минимальным требованиям (по состоянию на середину 2022 г.), для высоконагруженных SSD-накопителей, используемых для хранения кэш-памяти рекомендуется выбирать SSD-диски с DWPD от 3 и более и TBW от 4 Тбайт в день.

Например, если гарантийный срок накопителя составляет 5 лет, то согласно формуле расчета: 4 Тбайт × 365 дней в году × 5 лет = 7300 TBW = 7,3 PBW.

Возрастное старение SSD-накопителей

С течением времени производительность SSD-накопителей постепенно падает. Обычно при правильной эксплуатации это происходит не катастрофически и проявляется наиболее сильно для высоконагруженных систем. К их числу относят, например, постоянно работающие серверные вычислительные модули и СХД. Но знать об этом лучше и тем, кто пользуется только ноутбуком.

Оценка реального допустимого срока службы SSD с учетом требуемой надежности не слишком проста. Это объясняется тем, что средний срок службы SSD сильно зависит от характера его реального применения.

Согласно сложившейся практике, многие не обращают особого внимания на заявленный производителем SSD срок гарантии, продолжая эксплуатацию SSD «до полного износа». Особенно свойственно владельцам домашних и мобильных устройств.

До недавнего времени этому не придавали особого значения. Многие успевали поменять свои компьютеры раньше из-за появления несовместимости их аппаратной начинки с новыми версиями ОС. Заодно обновлялись и SSD.

Но в последних версиях Windows, начиная с Windows 7, наблюдается высокая совместимость с оборудованием прежних лет. Поэтому в настоящее время нередко можно встретить шустро работающие на Windows 10 ноутбуки 10–12-летней давности. Очевидно, что гарантийные сроки их SSD-накопителей уже вышли.

В 2016 году компания Google и Университет Торонто опубликовали отчет по результатам исследования отказов SSD-накопителей в зависимости от возраста. Для исследования использовалась статистика, накопленная при эксплуатации SSD в облачных ЦОДах Google. Выборка получилась презентативной.

Согласно результатам, надежность SSD оказалась выше по сравнению с жесткими дисками. Практика показала, что менять их вследствие возникновения массовых отказов (аппаратных ошибок на уровне ячеек, оцениваемых по параметру Raw Bit Error Rates (RBER)), приходилось на 25% реже, чем заменять жесткие диски.

Отмечалось также, что сбойные блоки ячеек SSD появляются в процессе эксплуатации у 30–80% накопителей, сбой работы чипа управления регистрируется у 2–7% SSD-накопителей (в зависимости от типа используемой памяти). Первый сбойный блок появляется в течение первых четырех лет эксплуатации у 20–63% SSD-накопителей.

Рис. После первичного появления сбойных блоков происходит резкое нарастание их количества (исследование Google и Университета Торонто, 2016)

SSD-накопители: надежность и управление сроком службы. Рис. 2

На представленной диаграмме видно, как происходит нарастание количества дефектов после первичного обнаружения сбойных блоков (в среднем сразу обнаруживается 2–4 блока). Кривые разного цвета соответствуют моделям с разным типом организации памяти: одноуровневые (SLC), многоуровневые (MLC), трехуровневые (TLC), четырехуровневые (QLC). Например, для дисков MLC (сплошные линии), наблюдался резкий скачок нарастания ошибок после обнаружения второго сбойного блока.

В целом, как показали исследования, основные различия по долговечности флэш-памяти связаны с выбором типа используемых ячеек флэш-памяти:

  • SLC NAND способна выдерживать 50,000-100,000 циклов записи;

  • MLC NAND — до 3000 циклов записи;

  • TLC NAND обеспечивает 300–1000 циклов записи, то есть имеет самую низкую износостойкость.

На практике встречаются и другие параметры оценки долговечности SSD-накопителей. Например, пользуются таким параметром, как среднее время наработки на отказ (MTBF).

Способы повышения надежности работы SSD

Для повышения надежности и срока службы SSD-накопителей, производители предлагают применять различные технологии.

Метод «выравнивания износа» (Wear leveling) помогает обеспечить равномерное распределение циклов стирания по всему блоку памяти SSD. Встречаются два типа коррекции: динамическое и статическое выравнивание.

В первом случае алгоритм обеспечивает равномерное распределение данных и циклов стирания по блокам флэш-памяти NAND. Такой алгоритм используется при записи любых данных во флэш-память. При необходимости перезаписать данные происходит подключение нового блока взамен записи в прежний, что помогает SSD-накопителям работать дольше.

Статическое выравнивание износа помогает перераспределять уже записанные данные.

Метод коррекции ошибок (Error Correction Code, ECC) позволяет программно обнаруживать и исправлять битовые ошибки, а также проблемы, связанные с износом ячеек памяти.

Метод управления плохими блоками (Bad Block Management) помогает запускать диагностику и заранее выявлять плохие блоки во флэш-памяти NAND, выводя их из циклов записи.

Метод TRIM обеспечивает физическое уничтожение (стирание из карты разметки) блоков данных, которые больше не используются. Это помогает более эффективно управлять хранилищем, поскольку контроллер больше не обращается физически к недопустимым блокам.

На практике также используют специальные утилиты, способные оценить остаточный ресурс SSD-накопителей. Более подробно мы расскажем о них в другом материале.

Опубликовано 19.06.2023

Похожие статьи