Entry tags:
Текст искусственного интеллекта
Интересная статья о модном нынче ChatGPT. Точнее, вторая половина статьи — в начале они рассказывают историю компании, но я там ни одного имени не знаю кроме Маска, да и того знаю практически только в контексте твиттера :-) А авторы статьи концентрировались как раз на именах различных действующих лиц, а также на идее публиковать (или нет) исходный код.
В части о доходах компании пишут, что генерацию текста использует Duolingo. Кажется, я начинаю понимать, откуда там берутся фразы в духе «Ich bin ein Apfel».
Очень интересная тема вмешательства в обучение (школьники, при помощи ИИ «пишущие» сочинения). Лично мне пока что (но я настолько чайник, что легко верю, что я ошибаюсь) эти опасения кажутся примерно такими же, как опасения по поводу использования калькулятора на уроках математики. Можно пытаться запрещать, а можно понять, что мир поменялся, и нам придётся придумывать другие школьные программы. Взять то же умножение «в уме» — оно не несёт само по себе никакой смысловой нагрузки, оно полезно школьникам только для понимания принципов умножения, а также для «прокачки мышцы мозга». С изобретением калькулятора пришлось по-другому продумать школьные программы для того, чтобы дети выучили и то, и другое. Так и тут — нужно сначала понять, зачем дети пишут сочинения, а затем переделать школьную программу так, чтобы это же получалось сделать и в присутствии изменившегося вокруг нас мира.
Вообще, я до сих пор восхищаюсь нашими институтскими учителями, которые разрешали приносить на экзамены всё, до чего мы сможем дотянуться: конспекты, учебники, задачники, решебники, всё. Потому что они пытались проверить, как мы умеем решать задачки в условиях, максимально приближённых к реальным. Работы им было в разы больше, потому что нельзя было использовать задачи из популярных учебников, уж тем более вытаскивать задачи прошлых лет. Мы, кстати, ещё тогда задавались вопросом: в реальной жизни я могу спросить совета у товарища — почему я не могу прийти на экзамен с другом? Ну да, где-то черту всё же приходится проводить.
Возвращаясь к статье. Авторы упоминают возможность определения, был ли конкретный текст сгенерён ИИ. Упоминают некую filigrane (водяной знак), которую можно включать в текст. Я заинтересовался, нашёл описание (не знаю этот источник, но звучит правдоподобно). Идея в том, что ИИ генерит текст при помощи распределения вероятности каждого следующего слова, высчитанной на основании предыдущего текста. Но при этом ИИ не берёт тупо самое вероятное слово — тогда был бы детерминистский алгоритм, то есть на одну и ту же вводную ИИ всегда (до следующей сессии обучения самого ИИ) генерил бы один и тот же текст. Нет, ИИ всякий раз берёт случайное число — и по нему выбирает следующее слово (пропорционально его вероятности). Зная функцию вероятности, можно наоборот, посчитать диапазон случайных чисел, которые могли бы дать конкретно это слово в тексте. А генератор псевдослучайных чисел ИИ можно написать таким образом, что по восстановленному набору случайных чисел (с размывающими их диапазонами) можно опознать авторство ИИ. Пишут, что для идентификации нужно несколько сотен слов (я добавлю вопрос: наверное, нужен ещё и доступ к исходной базе данных, чтобы восстановить функцию вероятности?)
А самый кайф в конце статьи. ИИ же тренируется на реальных текстах. То есть, написанный ИИ текст можно с какой-то долей сходства приравнять к аппликации, куда человек вклеил кучу фрагментов работ других людей. В случае ИИ известны имена этих людей — можно поднять базу данных, на которых учился ИИ. И журналисты уже предрекают эпические баталии в судах по авторским правам.
По этому поводу не могу не прорекламировать недавно появившуюся на Arte передачу Le dessous des images, а точнее пересказать вот этот её выпуск про картину «Théâtre d’opéra spatial» художника Jason Allen. Картина выиграла какой-то там конкурс в Колорадо, после чего выяснилось, что её нарисовал ИИ. Ну, что значит «нарисовал» — Jason Allen прямо говорит, что он, может, и не прикасался к кистям (на самом деле, там была какая-то стадия окончательной обработки, но это реально несущественные детали), но это же он сумел сформулировать запрос ИИ таким образом, чтобы та нарисовала такую красоту!
В части о доходах компании пишут, что генерацию текста использует Duolingo. Кажется, я начинаю понимать, откуда там берутся фразы в духе «Ich bin ein Apfel».
Очень интересная тема вмешательства в обучение (школьники, при помощи ИИ «пишущие» сочинения). Лично мне пока что (но я настолько чайник, что легко верю, что я ошибаюсь) эти опасения кажутся примерно такими же, как опасения по поводу использования калькулятора на уроках математики. Можно пытаться запрещать, а можно понять, что мир поменялся, и нам придётся придумывать другие школьные программы. Взять то же умножение «в уме» — оно не несёт само по себе никакой смысловой нагрузки, оно полезно школьникам только для понимания принципов умножения, а также для «прокачки мышцы мозга». С изобретением калькулятора пришлось по-другому продумать школьные программы для того, чтобы дети выучили и то, и другое. Так и тут — нужно сначала понять, зачем дети пишут сочинения, а затем переделать школьную программу так, чтобы это же получалось сделать и в присутствии изменившегося вокруг нас мира.
Вообще, я до сих пор восхищаюсь нашими институтскими учителями, которые разрешали приносить на экзамены всё, до чего мы сможем дотянуться: конспекты, учебники, задачники, решебники, всё. Потому что они пытались проверить, как мы умеем решать задачки в условиях, максимально приближённых к реальным. Работы им было в разы больше, потому что нельзя было использовать задачи из популярных учебников, уж тем более вытаскивать задачи прошлых лет. Мы, кстати, ещё тогда задавались вопросом: в реальной жизни я могу спросить совета у товарища — почему я не могу прийти на экзамен с другом? Ну да, где-то черту всё же приходится проводить.
Возвращаясь к статье. Авторы упоминают возможность определения, был ли конкретный текст сгенерён ИИ. Упоминают некую filigrane (водяной знак), которую можно включать в текст. Я заинтересовался, нашёл описание (не знаю этот источник, но звучит правдоподобно). Идея в том, что ИИ генерит текст при помощи распределения вероятности каждого следующего слова, высчитанной на основании предыдущего текста. Но при этом ИИ не берёт тупо самое вероятное слово — тогда был бы детерминистский алгоритм, то есть на одну и ту же вводную ИИ всегда (до следующей сессии обучения самого ИИ) генерил бы один и тот же текст. Нет, ИИ всякий раз берёт случайное число — и по нему выбирает следующее слово (пропорционально его вероятности). Зная функцию вероятности, можно наоборот, посчитать диапазон случайных чисел, которые могли бы дать конкретно это слово в тексте. А генератор псевдослучайных чисел ИИ можно написать таким образом, что по восстановленному набору случайных чисел (с размывающими их диапазонами) можно опознать авторство ИИ. Пишут, что для идентификации нужно несколько сотен слов (я добавлю вопрос: наверное, нужен ещё и доступ к исходной базе данных, чтобы восстановить функцию вероятности?)
А самый кайф в конце статьи. ИИ же тренируется на реальных текстах. То есть, написанный ИИ текст можно с какой-то долей сходства приравнять к аппликации, куда человек вклеил кучу фрагментов работ других людей. В случае ИИ известны имена этих людей — можно поднять базу данных, на которых учился ИИ. И журналисты уже предрекают эпические баталии в судах по авторским правам.
По этому поводу не могу не прорекламировать недавно появившуюся на Arte передачу Le dessous des images, а точнее пересказать вот этот её выпуск про картину «Théâtre d’opéra spatial» художника Jason Allen. Картина выиграла какой-то там конкурс в Колорадо, после чего выяснилось, что её нарисовал ИИ. Ну, что значит «нарисовал» — Jason Allen прямо говорит, что он, может, и не прикасался к кистям (на самом деле, там была какая-то стадия окончательной обработки, но это реально несущественные детали), но это же он сумел сформулировать запрос ИИ таким образом, чтобы та нарисовала такую красоту!
no subject
https://www.pcmag.com/news/chatgpt-passes-google-coding-interview-for-level-3-engineer-with-183k-salary
no subject
Ну да, как калькулятор на математике. Не заменяет мышление, а помогает. Насчет же open books exam, мои студенты наивно верили, что это легче. А потом пыхтели до 12 ночи (я не верю в дедлайны, сидите, сколько хоите). Потому что мой курс был не на запоминание, а на понимание. А на понимание во время экзамена способны только выдающиеся таланты (встречал такое).
no subject