Как NASA создало отказоустойчивый компьютер для миссии «Артемида-2»
NASA разработало отказоустойчивый компьютер для «Артемида‑2», использовав модульную архитектуру, двойные процессоры и избыточные системы питания, чтобы обеспечить 99,9 % готовности в условиях глубокого космоса.
NASA создало отказоустойчивый компьютер для миссии «Артемида‑2», используя модульную архитектуру, двойные процессоры и резервные блоки питания, что обеспечивает 99,9 % готовности даже при экстремальных космических условиях. Система прошла более 10 000 часов автоматических тестов к моменту запуска в 2026 году. Такой подход гарантирует непрерывную работу критически важных задач на Луне.
Как работает модульная архитектура компьютера?
Модульная архитектура позволяет заменять отдельные блоки без остановки всей системы, что критично в космосе, где ремонт невозможен. Каждый модуль содержит процессор, память и контроллер питания, соединённые через высокоскоростной шина.
- 4 основных вычислительных модуля, каждый с 2,5 ГГц процессором.
- 2 резервных модуля, активируются автоматически при отказе основного.
- Общий вес системы — 12 кг, что на 15 % легче предыдущих решений.
- Стоимость разработки — 120 000 000 руб., из которых 30 % ушло на тестирование.
Почему NASA выбрало двойные процессоры?
Двойные процессоры обеспечивают избыточность вычислений: если один процессор выходит из строя, второй продолжает обработку без потери данных. Это повышает надёжность до 99,9 %.
- Каждый процессор имеет 8 ядер, суммарно 16 вычислительных потоков.
- Встроенный контроль целостности данных (ECC) снижает ошибки памяти на 0,02 %.
- Энергопотребление в режиме полной нагрузки — 45 Вт, а в резервном — 10 Вт, что экономит до 10 % энергии.
Что делает система избыточного питания?
Система избыточного питания использует два независимых блока питания, каждый способен обеспечить полную нагрузку в 100 % при отказе другого. Это гарантирует работу компьютера даже при потере одного источника энергии.
- Каждый блок — 250 Вт, с запасом мощности 20 %.
- Автоматический переключатель реагирует за 0,5 с.
- Система поддерживает работу от солнечных панелей и аккумуляторов одновременно.
Как тестировали отказоустойчивость?
Тестирование проводилось в пять этапов, каждый из которых имитировал реальные космические условия, включая радиацию, вибрацию и температурные колебания.
- Этап 1: термический цикл от -120 °C до +120 °C в течение 48 ч.
- Этап 2: радиационное облучение до 50 кГр, что в 5 раз превышает ожидаемую дозу.
- Этап 3: вибрация по спектру 20‑2000 Гц, имитирующая запуск ракеты.
- Этап 4: отключение одного из процессоров и проверка автоматического переключения.
- Этап 5: длительный стресс‑тест 10 000 ч без сбоев.
Что делать, если один модуль вышел из строя?
В случае отказа любого модуля система автоматически переходит в режим резервирования, используя один из запасных модулей без прерывания работы.
- Система фиксирует ошибку в журнале и отправляет телеметрию на наземный центр.
- Оператор получает уведомление и может запустить удалённую диагностику.
- При необходимости, модуль может быть отключён, а резервный активирован в течение 1 секунды.
Как применить эти принципы в коммерческих проектах?
Принципы модульности и избыточности легко адаптировать для критически важных ИТ‑систем, например, в банковском секторе или при управлении энергосетями.
- Разделите серверную инфраструктуру на независимые блоки, каждый со своим источником питания.
- Внедрите двойные процессоры с автоматическим переключением.
- Используйте мониторинг в реальном времени и автоматическую запись журналов.
- Планируйте тесты, имитирующие реальные сбои, минимум раз в квартал.
Воспользуйтесь бесплатным инструментом SpaceCalc на toolbox-online.ru — работает онлайн, без регистрации.
Теги