green_fr: (Default)
У нас на работе задались вопросом: может ли нам где-то помочь ИИ, и не надо ли нам задуматься об этом заранее, чтобы не пропустить очередную технологическую революцию. Сели с шефом, запустили ChatGPT, спросили у него, что он думает по этому поводу. Он накатал 3 страницы рац. предложений. Я потом прошёлся по каждому из них, примеряя, что может подойти конкретно к нашему отделу. Переспрашивал, если что-то непонятно. Просил сформулировать конкретный план действий, если что-то казалось перспективным. На следующем собрании мы просмотрели получившийся список и решили протестировать на конкретном примере.

У нас есть периодическая (раз в триместр) задача: приходит база Excel в несколько сотен строчек, одна из колонок которых заполнена свободным текстом. Например «клиент вышел на работу», или «умер», или «не надо временно ему платить, эксперт разбирается». И наша задача — по этому тексту проставить галочку «платить / не платить» (точнее: учитывать его в расчёте провизии или нет). Понятно, что можно перестроить процесс, чтобы эту галочку сразу ставили те люди, которые пишут этот текст. Но, во-первых, процессы строить долго, да это и не наша работа (мы этих людей не знаем, они по всей стране разбросаны). Во-вторых, у нас сейчас как раз тема прикрутить ИИ — вместо того, чтобы заставлять людей писать как роботы, можно попытаться научить робота понимать то, что написали люди!
Read more... )
green_fr: (Default)
Статья о двух подходах к построению ИИ: connexioniste («коннектирующий»? это современные нейронные сети — то, что нормальный человек представляет, когда ему говорят «ИИ») и symbolique («символические»? это программы, построенные на чётко сформулированных правилах — первые шахматные программы были именно такими). Чуть дальше в статье приводят ещё лучший пример символического ИИ: экспертная система по идентификации бактерий, начала 1970. Она уже тогда работала лучше врачей-людей, и уже тогда не допустили практического её использования, потому что непонятно было, чья ответственность в случае ошибочного диагноза.

Меня в статье больше заинтересовал подход к изучению ИИ. Автор начинает с констатации: нынешние LLM (он приводит результаты GPT-4) плохо решают арифметические задачи. Лично я обычно на этом месте говорил себе «ну да, а микроскоп очень плохо забивает гвозди — не для арифметики же делались эти системы!». Автор же цитирует исследование вероятности правильного ответа на задачки по сложению / умножению цепочки чисел от 1 до 100, а зависимости от длины цепочки. На 2 числах всё хорошо, начиная с 3-х чисел качество умножения резко снижается. Сложение держится до 6-7 чисел, затем вероятность получить правильный ответ тоже очень быстро падает до нуля. В этот момент я про себя отметил, что это примерно соответствует поведению человека: нормальный человек уверенно помнит таблицу умножения, но 5 чисел перемножить в уме уже не в состоянии.

Затем автор пересказывает разные подходы по улучшению этих показателей, оставаясь внутри парадигмы LLM. Например, сделать так, чтобы числа разбивались на токены не слева направо, а справа налево. Это действительно улучшает результат, но не радикально. Другой подход — делать отдельные токены для каждой цифры, причём привязывать к цифре ещё и её положение в числе. Ну и так далее — люди пытаются что-то изменить в сети и смотрят, что из этого получается. Не влезая глубоко в недра теории, просто поверхностно меняя правила на уже работающей сети.

И в этот момент я задумался, что перед нами внезапно появилось целое поле исследований. Грубо говоря, у нас была педагогика — как учатся люди. У нас была зоопсихология — мы изучали, что умеют делать собаки, вороны, дельфины, муравьи. А теперь мы можем изучать, что могут делать нейронные сети. То есть это не та же профессия, что построение этих сетей — они отличаются примерно как анатомия от психологии. И то, и другое про то «как устроен человек», но всё равно, это разные профессии.

Возвращаясь к теме двух систем: в какой-то момент автор предсказуемо сваливается в идею «истина где-то посередине», в том смысле, что нужно пытаться комбинировать коннектирующий подход с символическим. Приводит аналогию с нашим мозгом, у которого тоже есть система быстрого реагирования, аналог коннектирующего ИИ, и система вдумчивого принятия решения, аналог символического ИИ. Ну и напоминает, что современные LLM, конечно же, тоже умеют вызывать внешние экспертные системы, если понимают, что те смогут более эффективно решать поставленные задачи. Примерно как человек достаёт калькулятор.
green_fr: (Default)
Интересная статья в Le Monde о том, как школа реагирует / может / должна реагировать на появление в нашей жизни LLM.

Во Франции, начиная с этого года, есть уроки пользования ИИ (en 4ème et 2nde). Но это скорее для того, чтобы убедиться, что все дети понимают, как пользоваться ChatGPT — который подавляющее большинство детей и так уже освоило. Для самих преподавателей тоже предусмотрены курсы повышения квалификации, но пока что их прошло только 9% учителей. И только 14% учителей реально пользуется ИИ для работы.

Из интересных идей, как учителя могут вплести использование ИИ в свои уроки: скармливаешь ChatGPT условие выпускного экзамена, а затем разбираешь его вместе с учениками. Это как минимум даёт возможность показать на практике, что считается плюсом в ответе. Ну и увидеть, как ИИ может накосячить.

Интересная мысль, что не надо путать жизнь взрослого с жизнью школьника. Взрослый реально может эффективно использовать ИИ, потому что и он сам уже сформировался как личность, и процессы вокруг него более-менее известны, использование ИИ может просто ускорить его работу, сделать его самого более эффективным. В то время как школьник действительно ходит в школу не для того, чтобы выучить определение синуса, а чтобы привыкнуть к процессу обучения: читаешь определение, пытаешься понять его, затем читаешь задачу, разбираешь готовое решение, после чего сам решаешь похожую задачу, потом более общую — ну и так далее. Что именно произойдёт с процессом вот этого обучения, если в это время дать в руки школьника ИИ, непонятно.


Тема популярная, я сам несколько раз уже участвовал в подобных разговорах. Можно карикатурно пересказать две радикально противоположные точки зрения.

Первая: ура, прогресс идёт, мы победим. Дети в школе перестанут решать тупые задачи, которые за них может решить ChatGPT, освободив время на решение по-настоящему нужных задач. Как в своё время мы отказались от уроков по подготовке глиняных табличек или заточке гусиного пера — так и сейчас, нужно всего лишь признать, что какие-то умения стали ненужными — ну так и чёрт с ними. Чуть менее карикатурно: действительно, появление калькуляторов избавило нас от необходимости уметь пользоваться таблицами Брадиса. Как следствие: разрешить в школе пользоваться всем — в реальной жизни мы же имеем право пользоваться калькулятором, почему не в школе?

Вторая: всё пропало, это закат цивилизации. ChatGPT способен решать за детей какие-то базовые задачи, но отказавшись их решать самим, дети не смогут научиться решать более сложные задачи. Да что там, они даже понимать эти задачи перестанут. И тут проблема фундаментальная: если мы, люди, перестанем понимать передовой край науки, то и двигать её дальше мы не сможем — и уж точно не LLM, который учится на уже написанных текстах и по определению не может ничего сам нового выдумать, продвинет науку дальше. Ну и вообще, мы в школе учим не столько конкретный предмет, сколько развиваем собственные способности добиваться результата — а ИИ избавляет нас от этих усилий.

У меня нет никакого мнения по поводу потенциальной деградации обучения. И по поводу того, способен ли ИИ создавать что-то новое — точнее, лично мне кажется, что да, способен, потому что я не вижу, чем ИИ, обучившийся на уже имеющихся текстах, кардинально отличается от моего мозга, точно так же обучившегося на уже имеющихся текстах (мне сложно представлять какую-то «искру божью», которая принципиально отличала бы наш мозг от компьютерного, но это моё личное мнение, основанное исключительно на моей, ничем не подтверждённой вере).

Но что точно, это то, что школьным учителям придётся радикально пересмотреть концепт домашнего задания и оценок его. Потому что если в школе они ещё могут попытаться «всё запретить», то что ты будешь делать с домашкой? Да, это огромный труд для преподавателей — нужно не просто переписать весь свой курс, а сначала переопределить его цели, в уже потом переписать от начала и до конца. Как когда-то, при появлении калькуляторов, они были вынуждены пересмотреть концепт домашних заданий по математике. Или с появлением интернета — пересмотреть домашние задания, базировавшиеся на простом поиске информации.

У меня в прошлом году был такой опыт, не могу сказать, что очень успешный, но тем не менее. Я вёл курс ООП в java, и выдал студентам задание написать какие-то классы для сражающихся роботов (играли в парадокс заключённого — см. здесь и здесь). Очевидно, что можно было скормить моё задание ChatGPT, и он выдавал какой-то код. Очевидно, что с первой итерации этот код никуда не годился (несколько человек таки сдало мне неработающий код с комментариями чата «а вот тут вставь логику»), но за несколько итераций его можно было довести до ума. Но только если у студента есть понимание, что этот код должен делать, и как его тестировать. То есть, получилось как минимум задание на тестирование. Плюс, я сделал бонусное задание, которое было определено достаточно невнятно: сделать класс-арену для натравливания классов-ботов друг на друга. Тут тоже, конечно же, можно было припахать ChatGPT, но начинать нужно было с долгой формулировки соответствующего промта. То есть, как минимум нужно было понять, в чём состоит задание.
green_fr: (Default)
Сегодня с утра впервые ощутил на себе эффект глушилок. Еду на работу на велосипеде, на голове BlueTooth наушники, телефон в кармане, слушаю подкаст. Навстречу едет кортеж с мигалками — и пока он проезжает мимо меня, наушники перестают ловить сигнал от моего телефона :-) Раньше я только читал об этом эффекте! О том, что вокруг Кремля GPS показывает какие-то рандомные координаты и пр.

Просто для сравнения: когда я прохожу в Лувр, там стоит просвечивалка багажа и рамка для посетителей. Рамка — откровенная профанация, стоит исключительно для успокоения самих же туристов, потому что я, например, прохожу с наушниками на голове, с кошельком и телефоном в кармане — рамка светится, всем пофигу. Но пару раз я телефон оставлял в рюкзаке, который нужно ставить на ленту для просвечивания (профанация, но не до такой степени, чтобы проносить рюкзак). Так вот, в этой конфигурации сигнал ловится. С помехами, но ловится. А когда едет кортеж — то не ловится вообще ничего.

Для интересующихся, как выглядит кортеж во Франции. Дорога вдоль набережной (это выезд из Парижа в сторону правительственного аэродрома), и на каждом перекрёстке стоит по полицейскому, регулирующему трафик вместо светофора. Очень непривычно ехать на красный свет, если тебе машет постовой, но зато в итоге получается существенно эффективнее — ни паузы между потоками, ни блокировки перекрёстка: полицейский пропускает ровно столько машин, сколько нужно. Дрога двухполосная, перед кортежем едет пяток мотоциклистов, сгоняющих всех в правый ряд. Сам кортеж — машин 6-7, одна большая, остальные полицейские.
green_fr: (Default)
Отличная история в недавнем выпуске Le dessous des images (я продолжаю активно рекламировать эту передачу!). В 2021 году в Америки убили мужика. Убийцу арестовали, в этом году был суд. На суде свидетельствовал в частности сам убитый. В виде аватара, оживлённого ИИ, с голосом, синтезированным ИИ. Текст свидетельства, к сожалению, написал не ИИ, а сестра убитого (видео залито на её канале YouTube).

Первая мысль у меня, конечно же: Акутагава, «В чаще». Там тоже сначала сначала читаешь версию убийцы, потом спасшейся жертвы, под конец свою версию рассказывает дух убитого. Только это не художественная литература.

В передаче рассказывают о том, как работает правосудие в США. Сначала суд признаёт или нет вину обвиняемого. Затем, если виновен, уже на другом заседании судья должен определить наказание. И к этому заседанию стороны готовят impact statement — слезоточивые заявления, цель которых уже не убедить в виновности или невиновности, а склонить суд в сторону более или менее жёсткого наказания. Говорят, что это штат Аризона, и что там нет никаких технических ограничений на форму impact statement — почему бы и не ИИ. Видео начинается с дисклеймера: аватар говорит, что он — аватар. Затем эмоции: как я рад был бы быть сейчас вместе с вами, но нет, меня убили. Заканчивается ещё более эмоционально: фотография убитого на рыбалке, тоже затем обработанная ИИ, чтобы убрать его с фотографии, оставив пустую лодку.

В передаче говорят о практически однозначной негативной реакции на это видео у широкой публики. Действительно, если почитать комменты даже в YouTube сестры убитого, я не смог там долистать до какого бы то ни было понимания и поддержки этого жеста. Несмотря на такую реакцию, сестра убитого согласилась ответить на вопросы журналистов — за одно это её стоит уважать. Она действительно говорит о том, что выступления в этот день состояли в основном из воспоминаний, каким хорошим человеком был её брат — адвокаты защиты наоборот, пытались рассказать, какой это был мерзавец. Мне сложно, конечно, понять эту логику. Как будто убийство угрюмого человека — это меньшее преступление, чем убийство улыбчивого. Но в Америке процедура именно такова, и в ней поведение сестры вполне логично. Она рассказывает, как они с мужем подбирали нужные параметры, чтобы сгенерить наиболее симпатичную версию картинки на базе имевшейся фотографии. Причесали бороду. Поменяли футболку на нейтральную. Попробовали нарисовать его в костюме с галстуком — но нет, это было уже слишком.

Ещё более странным показалась мне реакция судьи. Понятно, что в передаче оставили буквально пару фраз. Но он говорит, что да, видео ему очень понравилось. И показалось искренним (genuine) — вот тоже, какой смысл он вкладывает в это слово? Он же не может думать, что ему только что показали настоящие мысли убитого 3 года назад мужика? В передаче при этом цитируют другого американского судью, который прямым текстом говорит, что это свидетельство сестры жертвы, которое выдаётся за свидетельство жертвы. Слов «лжесвидетельство» или «узурпация личности» он не говорит, но явно громко думает. На что сестра отвечает, что нет, конечно же, она не писала в тексте, который произнёс аватар, того, что не сказал бы сам её убитый брат. При этом надо видеть её лицо (если что, это 06:48) — такое ощущение, что она правда не понимает, о чём идёт речь.

Убийца в итоге получил максимально возможный по его статье срок.


Во второй половине передачи эксперт рассказывает, что в декабре 2024 года в американском суде использовали виртуальную реальность. Создали мир, надели судьям очки, чтобы они поставили себя на место обвиняемого и подумали, можно ли его действия трактовать как необходимую оборону. Потому что одно дело — объективное описание картины, а другое — как её видел человек в момент событий.

Другая история была в марте уже этого года. Подсудимый попросил вместо себя выступить симпатичного аватара. Но в том случае судья потребовала выключить видео и велела подсудимому говорить самому. Опять же, где грань? Почему можно попросить выступить вместо себя умеющего красиво формулировать адвоката, но нельзя запрограммировать робота? В том случае отдельно смешно то, что у подсудимого была компания по созданию аватаров. Судья в частности попросила не использовать суд в качестве платформы для саморекламы :-)

Подобные вопросы возникали и раньше. Например, в 1935 году впервые в суде использовали видеосъёмку — насколько картинка на плёнке может сравниться со свидетельством живого человека? Сейчас, конечно, этот вопрос уже вызывает улыбку. Но с развитием дипфейков непонятно, долго ли он ещё будет её вызывать. Потому что визуальное подтверждение очень сильно усиливает доверие к словам.


Чтобы немножко разбавить эту вот атмосферу «Чёрного зеркала». За пару выпусков до этого передача рассказала историю чувака на каяке, которого проглотил кит (эта история должна понравится [personal profile] mbla, я просто слышу её голос в собственном пересказе). Проглотил и выплюнул, потому что каяков кит не ест. Это событие попало на видео — 360° камера стояла на корме каяка отца нового Врунгеля. Папа обернулся на необычный шум, пока оборачивался — кит сына уже выплюнул. «Папа, меня кит проглотил!» «Так, не выдумывай!» Дома рассмотрели видео, офигели. В передаче, впрочем, показывают несколько других, аналогичных видосиков. С людьми, с тюленями. Киты тупые, им в рот попадает, что угодно.
green_fr: (Default)
Полочка 009/120. На последней странице обложки обещали очередной заснеженный триллер. Американский по стилю (Салли останавливается в придорожном ресторане, где работает Молли...), но бельгийский по сути (действие а Бельгии, всё действительно завалено снегом, на который местные жители смотрят с откровенным непониманием). И очень быстро книга неожиданно подхватила тему, на которую мы совсем недавно разговаривали с [personal profile] kobak - как следует относиться к животным, которых мы (люди, наша цивилизация) выращивает на еду.

И с этой точки зрения книга просто прекрасна! Она сделана не в виде агитки (хотя мнение автора и проглядывает сквозь текст), и даже не в виде спора персонажей с разными точками зрения. Там большие куски, каждый написан с точки зрения какого-то персонажа, у которого есть время спокойно донести до читателя свои мысли. Начинается с инспектора, приехавшего проверять дела на птицеферме. Он вообще-то учился на ветеринара, но мало кто знает при поступлении, что работа практически любого выпускника заключается не в том, чтобы лечить животных, а в том, чтобы повышать производительность фермерских хозяйств. Описывают совершенно ужасный опыт работы, после которого герой стал вегетарианцем и перешёл на работу в контролирующие органы. Ну и параллельно огромное количество технических подробностей: как на самом деле выращивают этих самых курей. Да, действительно, цыплят-мальчиков яичной породы сразу посылают в мясорубку — они для индустрии бесполезны. Девочки тоже долго не живут — буквально через год у них падает производительность, и их либо в ту же мясорубку, либо (мизерную часть) продают частным лицам, желающим завести себе курочку в огород (прекрасный термин: une poule réformée). Ну а те породы, которые на мясо — это совсем жесть, они выкармливаются по ускоренной программе, буквально за 6-8 недель. У них за это время нарастает мясо, но не успевают развиться внутренние органы, поэтому в какой-то момент, если их вовремя не разрубить на филе и окорочка, они начнут дохнуть от инфарктов, от лёгочной недостаточности, да или просто ломать себе ноги, потому что кости тоже не успели сформироваться. И множество других аппетитных подробностей — навоз по колено, плотность на квадратный метр, искусственное освещение по расписанию.

После этого глава глазами фермера. Который прекрасно понимает страдания городских жителей по не знавшим свободе курицам, но который точно так же знает, что иначе этих самых горожан не прокормить. Рассказывает, почему свободно гуляющие на природе курицы — это утопия: нет у нас столько места на Земле, потому что гулять эти курицы смогут, если их выращивать медленно, а это значит, что не нам нужно не только в 10 раз больше места, но и в 10 раз больше времени, чтобы вырастить то же количество мяса. Ну и цена, конечно — красиво рассуждать в теории, но если выбирать между человеческим голодом (лично я смогу заплатить в 100 раз дороже на курицу — но много ли нас, таких буржуев?) и запертыми в помещении курицами, он однозначно выбирает второе. В этой части тоже куча каких-то неочевидных для меня технических подробностей, вроде того же регулирования роста куриц освещением. Книга начинается со снегопада: дороги заблокированы, перевозчик перенёс на пару дней вывоз кур с фермы на бойню — за это время курицы успеют вырасти так, что нарушат нормы максимальной плотности, а эти нормы тоже не на пустом месте писаны, поэтому фермер реально боится эпидемии, да или просто куриной паники, когда они себе тупо все ноги переломают. Другая интересная деталь: между разными «волнами» кур птицеферму очевидно моют / дезинфицируют, а после этого оставляют пустой на несколько недель, чтобы минимизировать вероятность переноса бактерий от предыдущего поколения кур к следующему.

Аналогично глава глазами дочери фермера, молодой эко-активистки. Она ненавидит работу папы — а папа постоянно боится, что она с друзьями сделает какую-то подлянку, типа выпустит кур на свободу (где они все сдохнут на месте). Взгляд глазами местного владельца ресторана, глазами той самой официантки Молли, муж которой работал на ферме, пока не повесился. Ну и так далее. Отличная книга!
Read more... )
green_fr: (Default)
Наступил на днях на прекрасные грабли. Почему-то (долгая история, но в двух словах: я был не прав) я решил отреагировать на присланное мне сообщение с предложением «проголосовать за детскую картинку». Проголосовал и забыл, но это было кидалово, и каким-то образом это дало его авторам доступ к моему Telegram. Я не помню, чтобы я там вбивал какие-то свои данные (я был невменяем, но не настолько), да и вообще, что я мог дать? Насколько я понимаю, Telegram без пароля работает, он привязан к номеру телефона, вся аутентификация проходит через него. Видимо, в какой-то момент я нажал «да, это я», думая, что подтверждаю своё голос за картинку — а вместо этого подтвердил кому-то право распоряжаться моим телеграмом.

Тут же мне посыпались сообщения от друзей, правда ли мне нужны деньги, и не хакнули ли мой телеграм? Сообщения я получал только по другим каналам (WhatsApp, FB messenger, e-mail, Viber, etc.), потому что в телеграм я к тому времени войти уже не мог. Видимо, получив доступ, хакеры первым делом закрыли все мои сессии. Войти заново тоже сложно, потому что (опять же, это моя догадка) они же запустили бота, который пытался открывать мою сессию с неправильными подтверждающими кодами. Поэтому каждый раз, когда я пытался зайти в телеграм, мне говорили «слишком много попыток, попробуйте зайти позже». Раз на 10 зайти получалось, но меня тут же снова выкидывало — я думаю, что это тоже пиратский бот следил за открытыми сессиями и закрывал всё, что не их.

Я попытался снести свой account, но тут типичный pkunzip.zip: для того, чтобы снести телеграм, нужно зайти в свой телеграм и нажать на кнопку «снести телеграм». А я не могу зайти в свой телеграм. Написал в support — никакой реакции. Через день написал ещё — аналогично. Через день ещё — ответа нет до сих пор.

Решение в итоге предложил Максим (Макс, спасибо тебе ещё раз, огромное!) — есть сайт, с которого можно уничтожить телеграм. С первого взгляда это тот же pkunzip.zip: для подтверждения нужно ввести код, который пришлют на телеграм. Но каждый раз, когда у меня получалось зайти туда, у меня была пара секунд, прежде чем пиратский бот выбрасывал меня. Так вот, за это время нужно открыть чат с подтверждающим кодом и сделать screenshot. Подтверждаю, это реально. Но не с первого раза :-)


Какие выводы я делаю из этой истории?

1. Очевидно, не вестись ни на какую ерунду, даже если очень хочется. Как следствие: не рассылать ерунду, даже если кажется, что она безобидна. Ваша ерунда (открытка с Пасхой, голосовалка за песенку и пр.) безобидна, но она помогает проскочить небезобидным сообщениям. Мессенджеры лично мне нужны в первую очередь для общения, а не для очередного «Христос воскресе».

2. Мне прислали несколько примеров чатиков с просьбами денег. Они выглядят достаточно примитивно, но уже с минимальной адаптацией к контексту. То есть не просто «дай мне денег», а «Юля, ты не могла бы меня выручить до пятницы»? Имя берётся из профиля. Очевидно, что имея доступ к нашей переписке, очень просто сгенерить сообщения, которые будет очень сложно отличить от настоящих. В этот раз вроде как пронесло — те, кто реально готов дать мне денег, понимали, что мне вряд ли нужны сейчас гривны или рубли :-) Самая лучшая реакция — «Привет! Вы с Анечкой сейчас в Киеве? Денег на гостиницу не хватает?» Но я боюсь, что очень скоро пираты научатся использовать контекст, благо в мессенджерах его полно.

По этому поводу практически анекдот. Один человек мне сказал, что ему сразу было понятно, что это не я писал, потому что в тексте не хватало запятой — явно не мой стиль. Другой заметил, что перед одной из запятых был пробел — такого я бы тоже себе не позволил. Это была минутка света в этой истории, спасибо, друзья :-)

3. По поводу адаптации к контексту — очевидная борьба с ним, это связаться с человеком по другому каналу и уточнить, правда ли ему нужны деньги. То есть, как минимум нужно иметь много разных каналов связи. С другой стороны, очевидное средство борьбы с этим средством борьбы — убеждать, что не надо мне сейчас звонить. Например, что я в полиции / военкомате, не хочу привлекать к себе внимания, и у меня есть ровно полчаса, чтобы «решить проблему». С этим бороться можно только переездом в страну с меньшим уровнем коррупции.

4. После этой истории должно быть понятным, зачем именно Европа требует от Телеграма и аналогичных сервисов иметь вменяемое количество людей на техподдержке. Потому что да, можно сказать, что рынок решает всё, и люди просто перестанут пользоваться сервисами без нужной им поддержки. Но скажите честно, кто из вас уйдёт из Телеграма (или любого другого сервиса) после аналогичных историй? Конечно же, никто. Все будем колоться, но продолжать есть кактус. Рынок здесь начнёт работать только когда будет уже совсем поздно — когда поток скама превысит порог терпимости пользователей. А для этого нужно, чтобы каждого пользователя кинули, а лучше несколько раз. С этим, мне кажется, согласны все, расхождения начинаются после: либо нам нравится государство, и мы делегируем ему установление нужных нам правил, даже если они мешают чьему-то бизнесу. Либо нам нравится теория Дарвина, и мы с удовольствием наблюдаем за тем, как самые доверчивые из нас попадают в ловушку — рано или поздно они научатся (ну или вымрут, жалкие лузеры).


Телеграм я уже восстановил. Потому что есть несколько человек, с которыми это единственный канал связи. Ну и потому, что проблема, конечно же, не в телеграме — эта же ситуация могла произойти в любом другом мессенджере, разница исключительно во времени реагирования техподдержки. У меня потерь немного: время, история дружеских чатиков и членство в разных группах. Выпьем же за то, чтобы это была самая моя большая потеря в этом году.
green_fr: (Default)
У Анюты на экзамене была задача. Есть колода 52 карты. Мы тянем карты одну за другой (без возврата карт в колоду) до тех пор, пока не попадём на туза. Наша случайная переменная — порядковый номер первого туза в колоде. Какое мат. ожидание у этой переменной?

Интуитивно задача решается достаточно просто. Если у нас в колоде один туз, он в среднем как бы делит колоду на две части, правильный ответ n/2, где n — количество карт в колоде. Если у нас 2 туза, то они делят колоду на 3 части, ответ n/3. И так далее, значит правильный ответ с 4 тузами 52/5=10,4.

В принципе, это даже можно вывести формулами, через приближение суммы интегралом. По крайней мере на двух тузах это делается: каждая раздача с двумя тузами соответствует клеточке (X, Y), где X — положение первого туза, Y — положение второго. Все раздачи равновероятны, но нас интересует положение первого туза. Переформулируем: нас интересует среднее X, но только такое, где X < Y — то есть, интеграл не по квадрату, а по треугольнику. Когда мы интегрируем, у нас получается x^2dx, в процессе интегрирования которого вылезает та самая 1/3, которая в правильном ответе. Можно, наверное, довести до ума эту формулу и с 4 тузами. Но, во-первых, это явно не то решение, на которое рассчитывает лектор. И по-любому, это же приближение: у нас изначально была сумма, а не интеграл. Как решать эту задачу «честно»?

Мат. ожидание дискретной переменной — это сумма по всем значениям k*P(x=k). Я даже могу выписать P(x=k), но там получается достаточно уродская дробь с 4 факториалами, и я не вижу, как можно упростить / посчитать эту сумму.

Спросил, понятное дело, у ChatGPT. Сначала по-русски. Тот начал с геометрического распределения, ответ 13. Нет, говорю, это если мы каждую карту на место кладём и снова перемешиваем. А, говорит, точно! Значит ответ 53/5=10,6. В принципе, совместимо с тем, что я написал — действительно, в случае с одним тузом у нас не n/2, а (n+1)/2. Но как он это посчитал? Он ссылается на формулу как на «известный факт». Просишь вывести «известный факт» — он его выводит, заменяя самую интересную часть на «можно показать (по свойствам порядковых статистик)». Просишь разжевать это — пишет примерно то же самое, но с «после некоторых алгебраических преобразований». И только после того, как просишь его и это разжевать — что-то пишет, из чего можно восстановить доказательство. Долгое и нудное, но правильное. В частности подсмотрел у ChatGT другую формулу для мат. ожидания: сумма P(x>=k). Работает только, когда возможные значения — последовательные целые числа, но у нас именно этот случай, и в этой форме результат записывается проще.

Спросил то же самое по-французски. ChatGPT сразу написал какую-то галиматью с выводом кучи совершенно ненужных вещей, а последней фразой сказал, что нужно разделить всё на количество тузов, и вместо того, чтобы разделить свою галиматью на 4, разделил непонятно откуда взявшееся 53 на 5, чтобы получить правильный ответ. В этот момент я попытался представить работу современного преподавателя, которому нужно вот это проверять :-)

Спросил по-английски, ChatGPT сразу же выдал мне ответ 13, потому что ну это же геометрическое распределение! На этом моя квота на приличную модель закончилась, я не стал приставать к более простой.

Собственно, вопрос: а как это решать в условиях экзамена? Предположим, мы не помним правильного ответа, и наша интуиция временно отошла, надо именно вывести формулу. Это реально сделать за несколько минут? Экзамен на 2 часа, в нём 30 вопросов.

Future now

Sep. 26th, 2024 08:58 am
green_fr: (Default)
Рассылка ЖЖ напомнила, о том, как я в 2006 году писал о том, что во Франции собираются переходить с квитанций о неоплаченной парковке на лобовом стекле - ко всё ещё бумажным, но присылаемым по почте. В посте гениальная идея о том, что нужно срочно придумать смартфон аппарат, способный автоматизировать процесс: наводишь на неправильно припаркованную машину (мысль о том, что и оператор тоже не нужен, тогда не то что казалась фантастикой, она просто была нереальна), а он сам фотографирует, распознаёт номер, передаёт на сервер, где квитанцию распечатают, наклеют на неё марку и пошлют по почте.

Удивительно, как за какие-то 15 лет изменилось всё. И как изменится ещё через 15. Собственно, для этого лично мне и надо всё это записывать.

Из нынешних примет времени: сломалась ДУшка для freebox. Несколько лет не нужна была - телевизор мы уже давно смотрим тогда, когда мы что-то хотим посмотреть, а не тогда, когда это что-то показывают "в эфире" (прекрасный термин "линейное телевидение" - это когда передачи одна за другой, с программой передач). Но тут внезапно понадобилось - захотели матч посмотреть (четверть финала по гандболу - если вы вдруг не следили, Франция достаточно эпично выиграла). Пульт не работает, что делать? Открываешь телефон, скачиваешь приложение "télécommande freebox". И всё. Телефон работает в качестве пульта ДУ.

У Анюты наушники, которые передают звук через кости черепа (в сентябрьской книге нашего клуба рассказывают о том, как появлялся слух, какие варианты его существуют в живом мире, и как подобные наушники используют уже не используемые человеком механизмы слуха). Плюс таких наушников не сразу очевиден, но с открытыми ушами получается комфортнее - например, когда едешь не велосипеде, ты лучше слышишь подкрадывающийся к тебе автомобиль. Ну а в случае Анюты скорее минус - с её причёской никогда не видно, в наушниках она или нет.

Появился сервис (justwatch), о котором я долго мечтал: вбиваешь название фильма, а он тебе говорит, на каком стриминговом сервисе он сколько стоит, и в какие абонементы он включен. Сервис, впрочем, наверняка очень быстро устареет - поисковые машины его съедят. Хотя пока что результат у google существенно хуже - он показывает только несколько первых сервисов.
green_fr: (Default)
Ездил несколько недель назад на море, наткнулся на новый вариант платной дороги — вроде как платная дорога, но денег с тебя нигде не берут. Я краем глаза отметил таблички péage en flux libre, но проверить, что они обозначают, очевидно забыл — денег не взяли, что мне ещё надо?

Сегодня приходит письмо. Вы знаете, у нас действительно с 19/06/2024 эксперимент, пускаем всех без оплаты. Но под обязательство заплатить потом на сайте в течение 72 часов. Вы проехали на 2,60€. Поскольку не оплатили вовремя, то добавляем стандартный штраф в 90€, итого 92,60€ (я такой: что?!!).

Впрочем, это ваш первый раз, возможно вы просто были не в курсе, как это работает (я такой: да-да-да!!!), поэтому мы вам добавим какое-то время на оплату без штрафа. Если оплатите до 10/08/2024 года (я такой: так, какое у нас сегодня число?), то с вас всё ещё 2,60€. До 20 августа 12,60€. Потом 92,60€. Если всё равно не оплатите — суд и 375€, если судья признает вашу вину.

Успел до 10-го :-) На сайте пишут, что есть как минимум 2 кусочка: A14 (это там, где я проехал) и какой-то кусочек A4 под Metz. Мы на A4 совсем недавно были, не заметили — то ли это отдельные полосы вроде télépéage, то ли это отдельный кусочек для тех, кто едет в город, например. Непонятно.

На сайте можно просто заплатить, а можно создать account и получать по мейлу напоминания, если ты где-то проехал и не заплатил (я сделал). Можно подписаться и на автоматическую оплату, но там чуть сложнее — нужно загрузить какие-то документы о том, что это действительно твоя машина. Может показаться странным, что кто-то захочет на автомате платить за чужую машину, но наверняка это сделано из соображений охраны личной информации — подписавшись на кого-то, всего за 2,60€ я могу знать, когда он ездил по конкретной дороги. Целый простор от слежки за неверной женой до планирования ограбления, когда хозяина дома нет.
green_fr: (Default)
Во Франции регулярно всплывает тема ограждения детей от порнографии. Регулярно пытаются ввести какой-то контроль возраста, но как только дело касается практики, ничего не выходит. Потому что самый очевидный вариант — это заставить порносайты проверять возраст, требуя у посетителей регистрироваться при помощи паспорта или кредитки, но граждане не доверяют порносайтам. Есть ещё вариант государственного сервиса аутентификации (во Франции уже есть France Connect — максимально децентрализованная система, когда ты можешь идентифицироваться через любой подходящий тебе ресурс, прошедший государственную сертификацию), но тут уже граждане не хотят рассказывать государству, сколько времени они проводят на порносайтах.

Короче, до сегодняшнего дня я думал, что это досье так и не сдвинулось с мёртвой точки. А тут захотел посмотреть (вы не поверите!) сериал на Arte, включаю телевизор, а там предупреждение: этот сериал 16+, поэтому он доступен только с 22 часов до 6 утра (можно подумать, в это время все 16- спят...) Если вы хотите посмотреть его прямо сейчас, аутентифицируйтесь и докажите свой возраст.

Ну ок, заодно и узнаю, как оно нынче работает (последний раз я с этим сталкивался всё на том же Arte в 2010 году, но тогда хотя бы была настоящая эротика). На экране QR-код, фотографируешь его и попадаешь на сервер аутентификации Arte. Там предлагают сфотографировать паспорт, права или ID-карточку (для иностранцев есть вариант carte de résident, туристы этот канал не смотрят). Тоже, конечно, странно — что, ребёнок не может сфотографировать паспорт родителей? CNI моя не прошла, старый формат (типичное «это Франция» — на карточке написано, что срок годности 10 лет, но «все знают», что «на самом деле» срок 15 лет. То есть, моя карточка до 2020 года, на самом деле до 2025 — поди объясни это польскому пограничнику). Права тоже старого формата — интересно, а их вообще можно / нужно менять? Сработал только паспорт. Причём сначала попросили его сфотографировать, а потом положить на паспорт телефон, чтобы он прочитал биометрический чип. До чего техника дошла!

Пока разбирался, обеденный перерыв закончился, про сам сериал ничего сказать пока что не могу.
green_fr: (Default)
Статья о том, как работают LLM (ChatGPT сотоварищи). Журнал старый, я в своё время пересказал оттуда прекрасную статью про атомные реакторы и забыл, что там ещё что-то есть. С тех пор я успел прослушать пару курсов и о том, как работают LLM, и о том, как ими пользоваться (Andrew Ng, один курс «ChatGPT для инженеров», другой — «ChatGPT для программистов», оба рекомендую). Это у нас на работе начальник хочет побаловаться, но сам ещё не понимает, как именно — просит меня разобраться и рассказать ему.

В статье прекрасный пример того, что могут «видеть» LLM. Современные смайлики — это же не картинки, это символы, такие же, как и буквы (Le Dessous des Images на эту тему недавно делали выпуск о том, как это работает). Один из вопросов, которые пытались задавать LLM: вот тебе набор смайликов, какой фильм они описывают? Ничего фантастического, конечно, просто один дополнительный шаг от кода символа к его имени. Но мне понравилось.

Другой пример. LLM говорят: представь себе, что ты — консоль Linux. Если я тебе говорю вот такие команды — что ты напечатаешь? И команды кода на питоне, программа печати простых чисел. И LLM печатает простые числа. В статье пишут, что LLM это делает быстрее, чем настоящий терминал Linux, но эту фразу я не понял — быстрее, чем терминал на какой машине? На машине задающего вопрос? (ничего удивительного) Или на машине, где крутится LLM? (это было бы действительно странно; это может работать для каких-то редких задач, где ресурсов требуется много, но при этом они настолько знамениты, что в корпусе текстов есть прямые ответы на них)
Опять же, в курсах выше по ссылкам хорошо расписывается вот этот механизм, когда ты не просто разговариваешь с LLM, а сначала настраиваешь её на определённый стиль («представь себе, что ты — моя бабушка»). Рассказали, как это работает, и как этим пользоваться — я теперь начинаю половину своих запросов с «Ты — эксперт в MatLab...» и прошу не просто ответить, а объяснить свой ответ.
А в другом ролике (Андрей Карпати в двух словах рассказывает о том, как работают LLM) говорят, что на такие модели можно смотреть как на ОС: ядро как бы использует периферийные устройства или процессы. Там же, кстати, прекрасный набор jailbreak, примерно с 46 минуты — рекомендую посмотреть всем, это как минимум смешно.

Возвращаясь к теме настройки на определённый стиль. Авторы пишут, что это теоретически может помочь с проблемой перекоса в наших данных. Понятно, что LLM тренируются на реальных текстах, написанных реальными людьми. И если (а это так) большая часть людей — расисты и мизогины, то и натренированная на их текстах система будет производить тексты с расистским и мизогинним уклоном. Но система же знает, что это расизм и мизогиния, потому что она тренировалась и на текстах, соответствующим образом маркирующих подобные тексты. Поэтому (такой эксперимент проводили, вроде как работает) можно сказать системе во вводной «ты не расист, ты за равноправие полов» — и она откорректирует свой ответ.

Интересная тема эмерджентности (очень странно звучащий термин). Это не только про ИИ, это вообще про системы с чертами, происхождение которых невозможно проследить до составляющих систему деталей. Применительно к ИИ: в 2020 году сделали список характеристик ИИ, за которыми было бы интересно наблюдать (BIG-bench от Beyond the Imitation Game — красивая отсылка к Тьюрингу). Какие-то характеристики постепенно улучшаются при постепенном усложнении ИИ. Какие-то не двигаются (в основном, они около нуля — не работают). А какие-то характеристики не работают до определённого уровня сложности ИИ, после чего они рывком «проявляются». Пример: арифметические операции. До примерно 13 миллиардов параметров GPT не может складывать и умножать числа. А после — резко приобретает это умение. Для других систем порог может находиться в другом месте, но конкретно с этим примером порог есть у всех. Очень интересно понять процесс вот этого появления характеристики, «рождения разума».
green_fr: (Default)
Отличная тема статьи Le Monde: книги, написанные ИИ.

Пишут в основном про Amazon KDP (Kindle Direct Publishing — платформа самиздата, как в электронной форме, так и в физической). Про то, что недавно Амазон решил бороться с написанными роботами книгами, и ограничил количество книг, которое может выкладывать один автор, до 3 книг в день (нет, это не опечатка: три книги каждый день день можно). Плюс обязательство указывать авторство ИИ для текста (в том числе перевода) и иллюстраций. Если при этом ИИ использовалось только для улучшения написанного человеком текста (в том числе для поиска новых идей), это можно не декларировать, это другое. Тонкая грань.

Понятно, пишут авторы, что серьёзную литературу так не сгенеришь. Но для любовных романов, вокзальных детективов, рецептов для похудения и советов как разбогатеть (мне очень понравился их набор) — может и сойти.

Как это работает? Приводят пример «автора», пославшего запрос к ChatGPT: напиши мне детскую сказку на 30 страниц про белочку Самми. Эта сказка теперь продаётся за 2,99$ в электронном виде и 9,99$ в бумажном — автор получает 70% от указанной суммы.

Очевидно, что люди, умеющие генерить книги с помощью ИИ, могут аналогично сгенерить и отзывы читателей. Поэтому полностью механизм выглядит так: ИИ генерит текст и обложку, полученную книгу выкладывают бесплатно на KDP. При помощи сгенерированных отзывов (каждый от фейкового account'а, который честно скачивает бесплатную книгу) автора продвигают как минимум в Top 1000. После чего можно выставлять его книги за деньги. Цитируют (настоящего) автора рецептов для похудания, который (совершенно справедливо) считает, что его профессия может исчезнуть.

Амазон тем временем изо всех сил пытается избавиться от фейковых account’ов и их комментариев, говорит про сотни миллионов удалённых комментариев — но скорее всего это капля в море.


Помимо хихикания над авторами, пишущими книги такого качества, что их мог бы написать и робот, тема действительно интересная.

Лично мне она кажется важной по той же причине, что я тут уже описывал на примере помидоров. Когда появились первые помидоры «без вкуса» (селекция концентрировалась не на вкусе, а на одновременности созревания, что существенно снизило стоимость помидоров), они были дешевле остальных. И очень скоро мы оказались в мире, где подавляющее большинство помидоров без вкуса, а чтобы найти вкусные, нужно изрядно постараться — мы же сами, сортируя списки товаров по стоимости, их и вытеснили. Аналогично с авиабилетами — оптимизируя исключительно по цене, мы получили авиакомпании, где за каждый чих нужно платить.

Так и здесь — мы очень скоро можем оказаться в мире, где более-менее стоящая литература погребена под толстым слоем автоматически сгенерённого говна. Задумайтесь над рынком книг с полезными советами, как починить компьютер или сделать ремонт дома. Найти стоящую книжку всё ещё будет можно, но примерно так же сложно, как уже сейчас найти интересный фильм в популярных стриминговых компаниях — только перекопав тонны шлака.


Другой интересный аспект — юридический (я бы об этом никогда не задумался, но газета цитирует руководителя профсоюза авторов). Что с авторскими правами на сгенерённые тексты? И что (это чисто французская штучка) с пониженной ставкой НДС, которая полагается книгам (5,5% вместо 20%)? Очевидно, что в законе, прописывающем исключения из стандартной ставки НДС есть определения (я не могу назвать свой автомобиль «книга» и претендовать на ставку НДС для книг). Так, во французских юридических текстах книга определена как «un ensemble contenant des écrits, illustré ou non, qui reproduit une œuvre de l’esprit d’un ou plusieurs auteurs en vue de l’enseignement, de la diffusion de la pensée et de la culture, quel qu’en soit le support». Ключевое слово здесь даже не «auteur», а «esprit» — ИИ явно не попадает под это определение. Не то, чтобы 15% спасли бы ситуацию (разрыв там не на 15%, а примерно на бесконечность), но как палка в колёса на первое время вполне сойдёт.
green_fr: (Default)
Прекрасная статья в журнале, когда есть куча конкретных деталей, видна чёткая логика того, что хочет сказать автор, и при этом то, что он хочет сказать — одновременно новое для меня и понятное. При этом авторы однозначно за атомную энергетику, это их специальность.

Начинают с того, что атомная Энергия предоставляет в настоящее время порядка 10% от всего вырабатываемого человечеством электричества, 5% от всей вырабатываемой энергии. То есть да, она вся из себя такая экологическая, но если мы хотим воспользоваться ею для снижения выбросов парниковых газов, то это автоматически приводит к увеличению потребления ядерного топлива в разы. А то и десятки раз, если мы учтём возможный рост потребления энергии жителями «третьих стран». И тут авторы переходят к заинтересовавшей меня теме: а что, собственно, является ядерным топливом?

1. Подавляющее большинство атомных реакторов работают на реакции распада урана-235 (235U). Он редкий, в природном уране его всего 0.7%, остальные 99.3% — другой изотоп, 238U. Реакция распада 235U запускается после попадания в него нейтрона: она выделяет энергию и ещё несколько нейтронов для обеспечения цепной реакции.

2. Проблема в том, что 238U с удовольствием поглощает нейтроны, которые необходимы были бы для цепной реакции. Способность его к поглощению нейтронов зависит от скорости последних, и если сильно замедлить нейтроны, то они будут чаще разбивать 235U, чем поглощаться 238U. «Сильно» замедлить — это потерять 9 нулей, если брать скорость нейтронов, вылетающих после распада 235U.

3. Замедлять нейтроны можно, наполнив пространство между атомами урана какими-то лёгкими молекулами, с которыми будет сталкиваться нейтрон, постепенно передавая им свою кинетическую энергию. Большинство работающих реакторов использует для этого обычную воду — она же отводит и энергию распада 235U. В этой конфигурации для поддержания реакции достаточно, чтобы 235U было 4% от общей массы урана.

4. Параграф в духе «ну что, кроты, посчитаем?»
Распад одной молекулы урана выделяет порядка 3×10-11 джоуля. Для сравнения, сгорание одной молекулы метана выделяет 10-18 джоуля, на 7 порядков меньше. Типичная атомная электростанция вырабатывает 1 гВт электричества. Учитывая 33% КПД, распад урана должен выделять 3 гВт энергии. 3 гВт = 3×109 джоуля / секунду = 1017 джоуля / год = 3×1027 молекул / год = 5 000 моль урана / год = 1 тонна 235U / год. В реактор засовывают топлива на 3-4 года, то есть порядка 80 тонн топлива, в котором 4% 235U. А добыча топлива на 1 год требует 200 тонн породы, которую потом «обогащают» до тех самых 4%, получая 27 тонн топлива и 173 тонны «обеднённого» урана (там остаётся 0.25% 235U).
Этот параграф нужен авторам, чтобы подвести читателя к мысли о жуткой неэффективности процесса, а также к желанию что-нибудь улучшить :-)

5. Дальше они рассказывают о варианте регенерации урана. Что происходит с 238U, после того, как он поглощает нейтрон? Он достаточно быстро превращается в плутоний: 238U + n => 239U => 239Np => 239Pu
Что происходит с этим плутонием? У него тоже два варианта: либо распад с выделением энергии и нейтронов (потенциальная база цепной реакции), либо захват нейтрона с превращением в 240Pu, который в дальнейшей работе реактора участвовать не будет. Соответственно, можно представить себе систему, состоящую из 238U и 239Pu, в которой происходит постепенный распад плутония с выделением такого количества нейтронов, чтобы хватило и на поддержание цепной реакции, и на производство плутония из 238U. То есть, количество плутония в этой системе будет оставаться постоянной. Формально мы используем его распад, но если смотреть на реактор как на чёрный ящик, то потребляется только 238U.

6. Что получается? Вместо расхода 200 тонн природного урана в год для производства 1 гВт электричества, есть вариант вырабатывать всё тот же 1 гВт из 1 тонны природного урана. Более того, на территории Франции уже есть 330 000 тонн 238U, поэтому на ближайшие 5000 лет можно не заморачиваться вопросами добычи топлива. Но всё это работает только при условии, что у нас была начальная масса плутония для запуска этой системы. Такое же количество плутония у нас так и остаётся, но для запуска оно необходимо.

7. Очевидно, не всё так просто, иначе бы все давно так и сделали. В описанной схеме один распадающийся атом плутония генерит в среднем 2.9 нейтронов, на которые у нас было сразу два плана: поддержать цепную реакцию плутония и генерировать новые атомы плутония из урана. И тут возникает ситуация обратная той, что описана в п.2 — если замедлять нейтроны, то практически все они будут поглощены плутонием — это произведёт тепло эффективно, но недолго.

8. В таком случае нужна жидкость, которая с одной стороны могла бы эффективно отводить тепло, но при этом не замедлять нейтроны. Самым перспективным для этого сейчас считается жидкий натрий (в статье упоминают ещё варианты с жидким свинцом или с гелием). И вот тут всё снова становится сложно и дорого.

9. Сколько нужно плутония? Расчёты показывают, что для того «типичного» реактора, который вырабатывает 1 гВт, нужно около 40 тонн топлива, 17% которого — плутоний. То есть, для запуска каждого такого реактора нужен первоначальный запас в 8 тонн плутония. Если учесть ещё цикл смены топлива (вытащить старое, выкинуть мусор, отделить плутоний — для запаса топлива, которое позволяет реактору работать 5 лет, этот цикл занимает 7 лет), то нужно порядка 20 тонн плутония.

10. Где взять этот плутоний? В статье прямо не говорят, но кажется, что единственный его источник — это текущие атомные электростанции. То есть, нельзя просто так взять и построить новую станцию (предположим, что все технические вопросы решены), нужно сначала запустить станцию на 235U, сгенерить нужный для старта новой станции плутоний, а потом уже строить новую станцию. И тут самое интересное: подразумевая одинаковые мощности, для выработки нужного количества плутония старая станция должна проработать порядка 60 лет.
То есть, во-первых, нет никакой конкуренции между «старой технологией» и «новой технологией» — вторая без первой невозможна. Во-вторых, казавшееся решение проблемы «конца урана» только частичное: оно позволяет продлить работу атомной энергетики, но без возможности увеличения мощности, которая ограничена всё тем же запасом 235U.

11. Я не стал вдаваться в детали реального мира, потому что там моих знаний совсем уж недостаточно. По статье похоже, что 10% вырабатываемой во Франции атомной энергии уже идёт по этой технологии (хотя и не с идеальным циклом повторного использования плутония). Судя по Википедии, США и Россия тоже работают над аналогичными проектами. А судя по тому, что плутоний имеет и военное назначение, можно помечтать о мире, когда цивилизация из бомбы и электростанции выберет электростанцию.

Статья заканчивается констатацией, что пока что Франция сохраняет статус-кво: пока уран дешёвый, можно не дёргаться, а там разберёмся. Переход на регенеративную систему возможен, если (когда) подорожает уран — то ли потому, что его станет меньше (страны-производители закроются), то ли потому что возрастёт спрос. Но в любом случае этот переход становится возможным только после нескольких десятилетий работы обычных реакторов.
green_fr: (Default)
В самом начале войны, когда пошли первые санкции, они в частности затронули родную alma mater. В нашем чатике по этому поводу прошлись: вот де мол, злобные американцы, под видом санкций пытаются подрезать крылья встающей с колен российской науки. Но никто при этом не мог сказать, за что именно ФизТех попал под санкции. В оригинальных документах (насколько я смог их причитать) был только список, без объяснения причин. Я написал запрос ректору института, нет ли у них информации, почему они попали под санкции. Если нет, то какие меры они принимают, чтобы понять, почему они туда попали. А если да, то принимаются ли меры по тому, чтобы из-под санкций выйти. Понятное дело, ответа не получил.

Зато недавний Le Monde, возможно, проливает свет на причины санкций. Как минимум, рассказывает о расследовании, в результате которого выяснились детали сотрудничества МФТИ с — я даже не знаю, как это назвать. Юридически, с государственной администрацией, с Роскомнадзором. Фактически, с прячущимися за вывеской Роскомнадзора спецслужбами, выполняющими незаконную слежку за российскими гражданами.

Газета упоминает расследование нескольких российских групп, которым взломавшие Роскомнадзор хакеры передали сотни тысяч документов. Из украденных документов следуют какие-то очевидные вещи: Роскомнадзор следит за публикациями в интернете и пытается блокировать информацию о том, как проходит война в Украине (целиком блокированы десятки российских и иностранных СМИ, сотни украинских СМИ, плюс 150 000 отдельных страниц). Информацию о найденных нарушителях Роскомнадзор точно так же предсказуемо передаёт ФСБ и пр. Точно так же предсказуемо, но уже менее легально — Роскомнадзор отдельно следит за сотнями российских журналистов и блогеров. (кстати, написал и задумался — учитывая нынешнее состояние российского законодательства, может это вовсе и легально, но я надеюсь, что нет)

Чуть менее ожидаемые вещи: Роскомнадзор следит и блокирует не только нарушения российского законодательства, но и просто публикации на неприятные властям темы, как то: ход мобилизации и здоровье лично товарища Путина.

Более того, из украденной переписки видно, что работники Роскомнадзора регулярно получали и выполняли совсем уж выходящие за их официальные должностные обязанности задачи, например организовывать атаки ботов и троллей в комментариях — раньше считалось, что этим занимается только Пригожин. Эти же боты использовались для проникновения в частные группы переписки (видимо, в расчёте, что хотя бы кого-то случайно да и примут), чтобы потом сажать людей на основании там опубликованного. Впрочем, пишут в газете, последнее остаётся маргинальщиной, основную массу осуждённых за неправильные слова заложили их живые собеседники.

Ну а потом рассказывают и о родном Институте, который действительно подписался помочь разработать систему автоматический слежки: Роскомнадзор сам справился с внедрением искусственного интеллекта в анализ текста, а ФизТех допилил туда же распознавание нарушений в картинках и видео. «Нарушений» как в терминах российских законов, так и в более широком смысле — всё, что не нравится Кремлю. Список очень смешной. Помимо «сравнений Путина с крабом» Физтехи подписались искать в картинках ещё пропаганду child free.

Прочитав после статьи в Le Monde оригинал расследования, я бы уточнил французских журналистов: в МФТИ не разработали софт, а только сделали спецификации и доказали его возможность. Сам тендер потом выиграли другие компании — в расследовании приводятся их имена.


Вообще, очень интересная тема. Буквально за неделю до этой публикации я прослушал серию подкастов Бремя технологий. Он вообще посвящён этике современных технологий, а последний выпуск практически только на эту тему: можно ли закрывать глаза на то, как используются твои разработки? В частности там приводился пример разработчиков софта, по которому во время ковида распознавали нарушителей московского карантина. Потом этот же софт применяли для идентификации и наказаний выходивших на антивоенные митинги. Рассказали о том, как по публичным источникам нашли участвовавших в разработке этого софта, и как сам только этот факт сильно дал по мозгам многим программистам — напоминает, что ты живёшь в реальном мире, а не внутри вот этой своей коробочки.

Понятно, что разработка такого софта — это всё-таки чуть лучше, чем наведение ракет на гражданские электростанции. И подкаст скорее об этом, о неожиданном для многих осознании необходимости понимать, где у каждого из нас проходит граница приемлемого. Кто готов работать над ядерным оружием? Кто готов работать на производителя сигарет или алкоголя? Кто готов администрировать базу данных наркоторговцев? Кто готов считать дифуры для того, чтобы ракета попала в жилой дом?


Ну и, чтобы закончить пост на оптимистической ноте, предлагаю прочитать (если ещё не) рассказ о том, как в Яндексе подменяли пользовательские запросы, чтобы россияне случайно не нашли то, что они искали. Это из другой утечки, тут выдали базу самого Яндекса. В предыдущем расследовании нашли стыковку с этой историей — у Роскомнадзора был специальный файлик, при помощи которого они сообщали Яндексу, какие ещё ключевые слова нельзя ассоциировать с товарищем Путиным.
green_fr: (Default)
Интересная статья о модном нынче ChatGPT. Точнее, вторая половина статьи — в начале они рассказывают историю компании, но я там ни одного имени не знаю кроме Маска, да и того знаю практически только в контексте твиттера :-) А авторы статьи концентрировались как раз на именах различных действующих лиц, а также на идее публиковать (или нет) исходный код.

В части о доходах компании пишут, что генерацию текста использует Duolingo. Кажется, я начинаю понимать, откуда там берутся фразы в духе «Ich bin ein Apfel».

Очень интересная тема вмешательства в обучение (школьники, при помощи ИИ «пишущие» сочинения). Лично мне пока что (но я настолько чайник, что легко верю, что я ошибаюсь) эти опасения кажутся примерно такими же, как опасения по поводу использования калькулятора на уроках математики. Можно пытаться запрещать, а можно понять, что мир поменялся, и нам придётся придумывать другие школьные программы. Взять то же умножение «в уме» — оно не несёт само по себе никакой смысловой нагрузки, оно полезно школьникам только для понимания принципов умножения, а также для «прокачки мышцы мозга». С изобретением калькулятора пришлось по-другому продумать школьные программы для того, чтобы дети выучили и то, и другое. Так и тут — нужно сначала понять, зачем дети пишут сочинения, а затем переделать школьную программу так, чтобы это же получалось сделать и в присутствии изменившегося вокруг нас мира.

Вообще, я до сих пор восхищаюсь нашими институтскими учителями, которые разрешали приносить на экзамены всё, до чего мы сможем дотянуться: конспекты, учебники, задачники, решебники, всё. Потому что они пытались проверить, как мы умеем решать задачки в условиях, максимально приближённых к реальным. Работы им было в разы больше, потому что нельзя было использовать задачи из популярных учебников, уж тем более вытаскивать задачи прошлых лет. Мы, кстати, ещё тогда задавались вопросом: в реальной жизни я могу спросить совета у товарища — почему я не могу прийти на экзамен с другом? Ну да, где-то черту всё же приходится проводить.

Возвращаясь к статье. Авторы упоминают возможность определения, был ли конкретный текст сгенерён ИИ. Упоминают некую filigrane (водяной знак), которую можно включать в текст. Я заинтересовался, нашёл описание (не знаю этот источник, но звучит правдоподобно). Идея в том, что ИИ генерит текст при помощи распределения вероятности каждого следующего слова, высчитанной на основании предыдущего текста. Но при этом ИИ не берёт тупо самое вероятное слово — тогда был бы детерминистский алгоритм, то есть на одну и ту же вводную ИИ всегда (до следующей сессии обучения самого ИИ) генерил бы один и тот же текст. Нет, ИИ всякий раз берёт случайное число — и по нему выбирает следующее слово (пропорционально его вероятности). Зная функцию вероятности, можно наоборот, посчитать диапазон случайных чисел, которые могли бы дать конкретно это слово в тексте. А генератор псевдослучайных чисел ИИ можно написать таким образом, что по восстановленному набору случайных чисел (с размывающими их диапазонами) можно опознать авторство ИИ. Пишут, что для идентификации нужно несколько сотен слов (я добавлю вопрос: наверное, нужен ещё и доступ к исходной базе данных, чтобы восстановить функцию вероятности?)

А самый кайф в конце статьи. ИИ же тренируется на реальных текстах. То есть, написанный ИИ текст можно с какой-то долей сходства приравнять к аппликации, куда человек вклеил кучу фрагментов работ других людей. В случае ИИ известны имена этих людей — можно поднять базу данных, на которых учился ИИ. И журналисты уже предрекают эпические баталии в судах по авторским правам.

По этому поводу не могу не прорекламировать недавно появившуюся на Arte передачу Le dessous des images, а точнее пересказать вот этот её выпуск про картину «Théâtre d’opéra spatial» художника Jason Allen. Картина выиграла какой-то там конкурс в Колорадо, после чего выяснилось, что её нарисовал ИИ. Ну, что значит «нарисовал» — Jason Allen прямо говорит, что он, может, и не прикасался к кистям (на самом деле, там была какая-то стадия окончательной обработки, но это реально несущественные детали), но это же он сумел сформулировать запрос ИИ таким образом, чтобы та нарисовала такую красоту!
green_fr: (Default)
У нас на работе постепенно заменяется «старая» система связи на «новую». Грубо говоря, телефоны — на Teams. И сегодня я внезапно осознал, что телефонные номера уходят в прошлое. Ещё непонятно, как именно они уйдут, но внутри компании я уже звоню не по номеру, а по имени. Мне не нужно запоминать или даже записывать в адресной книге какие-то абстрактные циферки (2-12-85-06), по которым автомат сможет меня соединить с нужным мне человеком. Мне нужно найти в каталоге нужного мне человека по его имени и позвонить ему. Мне даже не надо особенно задумываться, по какому из каналов я ему звоню — телефон ли это, Teams или смесь их обоих.

Интересно подумать, как (если) эта система будет расширяться на весь мир?

Есть проблема — та же, что и с номерами — что делать, если у двух человек один номер / одно имя / один идентификатор.
С телефонными номерами в своё время сделали просто: внутри каждой зоны гарантируется уникальность номера, а для связи между зонами сделали специальный префикс «я хочу выйти наружу», потом ты набираешь код той зоны, куда ты хочешь попасть, а потом — как будто ты звонишь внутри нужной тебе зоны.
С адресными книгами, понятное дело, сложнее. Как минимум потому что мы завязываемся на уже существующие идентификаторы, и мы не будем отказывать в найме человеку только потому, что «у нас в компании уже есть человек с таким именем».
Можно придумать «код зоны» — в принципе, примерно так уже работают e-mail. Или какие-то суффиксы — первый, второй и т.п. Но при этом пропадают все плюсы отказа от номера и собственной адресной книги — у тебя будет всё та же личная адресная книга, только вместо номеров там будут имена с какими-то другими идентификаторами (протокол, имя зоны в этом протоколе).

Наверное, можно сделать что-то в духе «я помню, в каком каталоге этот человек, и как там его зовут» (например green-fr из ЖЖ). Дальше подключаешься к каталогу (нужен общий протокол?) — и ищешь по нему, как я сейчас ищу нужного мне коллегу по рабочему каталогу. При условии открытости / наличия доступа к этому каталогу.
Понятно, что ты можешь быть одновременно в нескольких каталогах — я в ЖЖ, я на работе, я в нашем городе. Идеально было бы, с одной стороны, иметь связь между всеми этими записями (вне зависимости от того, как вы меня нашли, вы позвоните мне в одно и то же место, по одному и тому же, мною выбранному протоколу). С другой стороны, очевидно, что я не захочу, чтобы нашедший меня в рабочем каталоге тут же увидел, в каких других каталогах я есть. Да и вообще — а если я не хочу, чтобы мне звонили по имени? Позволят ли новые системы анонимные / псевдонимные звонки?
green_fr: (Default)
Прекрасная иллюстрация к термину «переписывание истории». Хоть в прямом смысле (постепенное переписывание одного и того же текста с полной переменой смысла в конце), хоть в переносном (выбор исторических фактов, подходящих под заранее определённую цель, подгонка интерпретации).

Тот случай, когда я считаю себя чуть ли не обязанным распространять эту информацию. Вне зависимости от того, как кто относится к Гитлеру, Сталину и т.п. — нельзя делать вид, что ничего не происходит. Либо нужно прямо говорить «да, мы наследники того режима и восхищаемся его решениями» — либо бить по рукам.

Ну и очередная радость от современных технологий, конечно. Очень сложно сейчас жить жуликам.


Поскольку ну очень уж красиво, скопирую и себе. Итак, история публикаций на сайте мемориала «Катынь»:

С 17 февраля 2015 года по 6 августа 2017 года:

1 сентября 1939 г. — Нацистская Германия нападает на Польшу.
17 сентября 1939 г. — СССР развязывает войну с Польшей.

С 7 сентября 2017 года по 23 апреля 2018 года:

1 сентября 1939 г. — Нацистская Германия нападает на Польшу.
17 сентября 1939 г. — Начало Освободительного похода Красной Армии.

С 20 по 25 мая 2018 года:

Осенью 1939 года, после присоединения к СССР Западной Украины и Западной Белоруссии, на советской территории оказались около 200 тысяч польских военнослужащих.

С 20 июня 2018 года и по настоящее время:

1 сентября 1939 года вторжением Германии в Польшу началась Вторая мировая война.
3 сентября Великобритания и Франция объявили войну агрессору, однако не оказывали реальной военной помощи полякам.
5–6 сентября польское правительство покинуло Варшаву. Германская армия, по всем показателям превосходящая противника, уже 8 сентября вышла к польской столице. К 16 сентября основные польские силы были разбиты или окружены. Западные союзники Польши так и не начали активных боевых действий против Германии, о которых они договаривались еще до начала войны.
17 сентября польское правительство перебралось в Румынию.
17 сентября 1939 г. власти СССР уведомили польского посла в Москве, что советская сторона больше не может сохранять нейтралитет в конфликте, поскольку польское государство практически перестало существовать, а украинцы и белорусы, проживающие на востоке Польши, остались беззащитными. В тот же день части Красной армии вступили на территорию Западной Украины и Западной Белоруссии. Польские подразделения на востоке страны почти не сопротивлялись советским войскам.
green_fr: (Default)
Статья в Le Monde о том, как «новые технологии» влияют на климат. Грубо говоря, сколько CO2 выбрасывается в атмосферу из-за каждого отправленного мейла. Понятно, что даже общие оценки выбросов от того же интернета более чем приблизительные. Понятно, что маргинальную стоимость отдельного действия рассчитать ещё сложнее. Понятно, что помимо отрицательного влияния (потребление энергии = выбросы парниковых газов) у этих же технологий есть и положительное влияние (уменьшение бумаги, дистанционные встречи и пр. — об этом как раз хорошо говорил наш министр в недавней Soft Power). И тем не менее, интересно почитать хотя бы эти примерные оценки.

Так пишут, что выбросы от «цифрового мира» (отдельный вопрос, что попадает в этот периметр) — примерно 2-4% от общих выбросов человечества. То есть примерно на уровне авиации. По этому поводу журналисты проехались: уже есть термин flygskam («летать стыдно» — я бы ещё добавил явно существующее «распечатывать стыдно»), скоро ли появится «стыдно ставить лайки» или «стыдно посылать мейлы с аттачментами»? Ну или такое красивое сравнение: выбросы от одного мейла с тяжёлым аттачем примерно эквивалентны выбросам от сотни метров на автомобиле. При всей приблизительности оценок, позволяет задуматься о самом существовании этого эффекта.

По поводу более точной оценки и в статье: и в интервью министра по радио рассказывали о трёх новых французских законах, первый из которых обязует различные компании (операторы связи, онлайн-сервисы, производители телефонов и компьютеров) предоставить государству их личные оценки их выбросов парниковых газов. Разумный первый шаг для оценки размаха явления. Меня удивило присутствие в списке «компаний разработчиков ОС» (читай: Microsoft), а точнее отсутствие просто «компаний разработчиков софта». Наверное, из-за распространённости — понятно, что Civilization VI жрёт в разы больше Windows 11, но последняя стоит на существенно большем количестве компьютеров.

На всякий случай, остальные законы. Второй закон о создании индикаторов, позволяющих потребителю сравнивать разные компании (видимо, на основе данных из первого закона). А третий — информационный. Уже с этого года операторы будут присылать нам информацию о том, сколько трафика мы потратили за месяц, с переводом в эквивалент CO2 (опять же, по какому-то относительно произвольному коэффициенту пересчёта).

В статье упоминают мельком, а министр именно на этом делал упор: огромный (и легко убирающийся) вклад в разрушение экологии из-за частой смены компьютеров и телефонов. Тут как раз проще всего что-то сделать — в момент продажи уже показывают какие-то индикаторы экологичности, теоретически можно на них повесить какие-то финансовые стимулы производить и покупать более экономное. В статье уже цитируют новые модемы от Orange, у которых потребление снижено на треть. И какие-то модели iPhone из переработанного вольфрама.

А вообще интересная тема. Про вклад криптовалюты в потребление энергии говорят часто — но там совсем уж карикатурное соотношение потребления к условному результату. Про вклад сервисов видео-стриминга в общий трафик тоже говорят — в статье цитируют специалиста, который оценивает выбросы Netflix примерно как у Чили. Достаточно мало говорят о потреблении энергии ИИ — наверное, потому что это всё ещё ми-ми-мишная тема. Ну и не до такой степени она ещё разрослась, хоть и растёт быстро, и перспективы роста практически бесконечные. Тут та же тема, только взгляд со стороны конечного пользователя. Через которого теоретически можно заставить измениться поставляющие ему сервис компании.
green_fr: (Default)
В Le Monde статья о рынке NFT, по оценкам он порядка 30 миллиардов долларов. Несмотря на заголовок про «рынок крипто-искусства», авторы сами же говорят, что большая часть транзакций не о предметах искусства, а о коллекционных вещах. Я уже видел новости о продаже первого твита или первого СМС. Но этим не ограничивается.

Есть, например, коллекционные аватарки — в статье рассказывают о CryptoPunks и Bored Apes. С одной стороны, идея заплатить тысячи или миллионы долларов за аватарку кажется идиотизмом. Но вместе с аватаркой идёт «членство в клубе». Например, ты будешь в одном чатике с другими купившими эти аватарки — если среди них есть твой любимый певец, то покупка уже не выглядит таким уж идиотизмом. Вспомним какие-нибудь сборы средств, когда заплатившим более определённой суммы обещали обед с определённым певцом или художником. Членство в клубе может давать тебе доступ к каким-то общим проектам (я читал про коллективные граффити, в которых каждый член клуба мог менять цвет одного пикселя каждые 15 минут). Ну и вообще, под «купил аватарку» обычно скрывается нечто существенно более сложное.

Когда я за ужином пересказывал статью, на фразе «Nike сбирается выпустить и продавать виртуальные кроссовки под NFT» Натан фыркнул от смеха. Погодите, говорит. Это означает, что ты просто сможешь открыть какой-то сайт. Залогиниться. И увидеть там «свои» кроссовки? И за это люди готовы платить?! Мы у него спросили, чем этот кажущийся «идиотизм» отличается от покупки скинов в Fortnite — он задумался. Тем, кому и покупка скинов кажется идиотизмом, можно задуматься о покупке красивой одежды — в предположении выбора между «красивой и дорогой» против «некрасивой и дешёвой», одинаковой во всём остальном.

В конце статьи анекдот про чувака, который купил много коллекционных аватарок, а в декабре 2021 года у него украли все его NFT на сумму более 2 миллионов долларов. Грабителей пока не нашли, но свой твиттер с просьбой о помощи он уже упаковал в NFT и продал. За 160$.

Profile

green_fr: (Default)
green_fr

December 2025

S M T W T F S
 1 2 3 4 56
7 8 9 10 11 1213
14 15 16 17 18 1920
212223242526 27
28293031   

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 3rd, 2026 06:15 pm
Powered by Dreamwidth Studios