Мистика в программировании
Mar. 20th, 2017 08:50 amОчень странная ситуация на работе. Полностью детерминистская программа, запускаешь её дважды с одинаковыми данными — получаешь дважды один и тот же результат. Всегда, кроме одного раза. Запустил программу, через несколько часов она вылетела с очень странной ошибкой (переменная, которая всегда была округлена до 0.0025 содержала одно значение типа 0.022500458651 — то есть никак не похоже на округление). Перезапустил ещё раз, ничего не изменив — и программа отработала.
Там нет никакой зависимости от времени. Все исходные данные остались одними и теми же. Все генераторы случайных чисел позиционируются на одну и ту же исходную точку. Какие ещё есть варианты? Дефектный процессор? Космическое излучение? Проклятье рода?
Там нет никакой зависимости от времени. Все исходные данные остались одними и теми же. Все генераторы случайных чисел позиционируются на одну и ту же исходную точку. Какие ещё есть варианты? Дефектный процессор? Космическое излучение? Проклятье рода?
no subject
Date: 2017-03-20 08:08 am (UTC)no subject
Date: 2017-03-20 09:11 am (UTC)no subject
Date: 2017-03-20 09:14 am (UTC)no subject
Date: 2017-03-20 09:19 am (UTC)no subject
Date: 2017-03-20 11:10 am (UTC)no subject
Date: 2017-03-20 01:09 pm (UTC)no subject
Date: 2017-03-20 08:12 am (UTC)no subject
Date: 2017-03-20 09:12 am (UTC)no subject
Date: 2017-03-20 11:13 am (UTC)no subject
Date: 2017-03-20 01:10 pm (UTC)no subject
Date: 2017-03-20 10:36 am (UTC)И тоже обнаружил в какой-то момент странный баг, программа вдруг начинала выдавать странные данные.
Я упростил ее до минимума (по-моему 2 умножал на 2) - и вот представь себе - в какой-то момент
на экране вдруг возникало не 4, а что-то другое.
Поверить в это было трудно, но факт.
Опытным путем выяснил, что перегревался процессор (или память)
Снимаешь корпус - баги исчезают. Одеваешь - появляется.
Вот так бывает.
no subject
Date: 2017-03-20 12:05 pm (UTC)no subject
Date: 2017-03-20 12:21 pm (UTC)это к тому, что мистики не бывает )
no subject
Date: 2017-03-20 12:24 pm (UTC)no subject
Date: 2017-03-20 04:48 pm (UTC)no subject
Date: 2017-03-20 02:29 pm (UTC)no subject
Date: 2017-03-20 02:32 pm (UTC)no subject
Date: 2017-03-20 02:46 pm (UTC)При этом где-то вскоре после войны возникла проблема с чувствительными детекторами. Сталь выплавленная примерно после 1945 года более радиоактивна чем довоенная. Чаще всего говорят, что это последствия испытаний (а концентрация трития, например, вроде как еще не стабилизировалась); но я слышал мнение что это утечки из датчиков использующих кобальт-60. И типа если поставить в лесу заводик, и выплавлять сталь из свежедобытой руды без металлолома, используя древесный уголь - то сталь будет вполне чистой.
термин pre-WWII steel исчезает из статей где-то в 70-х - резали линкоры второй мировой. Но запасы не вечны. А до того были даже планы поднимать немецкие подлодки, которые по operation deadlight потопили. Но похоже кто-то построил заводик... смотри выше. Впрочем, когда нашли древнеримский корапь с грузом свинца - тоже радовались...
Так что да, это не нереально. Особенно если ты радиацией балуешься - типа минералку любишь или что такое.
А вот тебе для примера память с защитой от сбоев. Продается...
https://www.newegg.com/Product/Product.aspx?Item=N82E16820148770
no subject
Date: 2017-03-21 02:52 am (UTC)Как человек, слегка причастный к наблюдению за программой, работающей минимум на десятках миллионов компьютеров, могу сказать - каждый день. :)
no subject
Date: 2017-03-21 10:35 am (UTC)no subject
Date: 2017-03-21 11:38 am (UTC)http://www.opsalacarte.com/pdfs/Tech_Papers/Soft_Error_Trends_and_Mitigation_Techniques_in_Memory_Devices_Presentation_by_Charlie_Slayman,Opsalacarte.pdf
Для процессора с большим кешем порядка 1 ошибки в год - и я не понимаю есть ли там защита по факту.
no subject
Date: 2017-03-21 01:25 pm (UTC)no subject
Date: 2017-03-21 04:27 pm (UTC)no subject
Date: 2017-03-20 02:46 pm (UTC)Error detection-то у них у всех есть.
Правда, это может быть просто дефектная палка памяти - и данные в блоке будут случайные, и детекции никакой. Видел такое один раз, выглядело как ошибки компиляции, если открыто много приложений вместе.
no subject
Date: 2017-03-20 02:52 pm (UTC)https://www.newegg.com/Product/Product.aspx?Item=N82E16820134045
считаем корпуса
понимаем, что никаких плюшек типа девятого бита там нет....
Помимо всего прочего, это еще размер ячейки играет. Было очень актуально с большими ячейками несколько микрон, на нанометрах все проще как ни странно.
Не знаю, испозльзуют ли еще изотопную BSG. БЫла очень дорогая штука, но помогала как ни странно...
no subject
Date: 2017-03-20 03:10 pm (UTC)