Появление книгопечатания в 1440-х годах
произвело революцию для развития цивилизации, без чего не было бы современных
технологий. Но в этом исследовании мы ограничимся рассмотрением современных
передовых технологий и исследованием тем, которые в настоящее время находятся в
центре внимания. Эти технологии стремительно развиваются, требуется огромное количество
специалистов в этих сферах, и все крупные и менее крупные компании ищут для
себя экспертов в этих технологиях.
Согласно «Стратегии развития отрасли
информационных технологий в Российской Федерации на 2014–2020 годы и на
перспективу до 2025 года» Министерства цифрового развития, связи и массовых
коммуникаций Российской Федерации, популяризация деятельности в сфере
информационных технологий (IT)
является одной из основных задач по развитию IT-отрасли России. По данным
Министерства цифровизации, в России нехватка
IT
-экспертов
– больше миллиона человек [1].
Уровень дохода, предлагаемый им, также
немаленький: специалистам в разных
IT-тематиках
готовы платить более 1000 долл. Да и вообще наш мир двигается в будущее. Описанные
технологии так или иначе с ним связаны и будут сопровождать развитие нашей
цивилизации. Статью можно назвать своеобразным продолжением работы [2], однако публикации
никак не связаны, авторы статей не аффилированы друг с другом, и эта рукопись отражает
совершенно иные стороны цифрового мира.
Искусственный интеллект (ИИ, англ.
Artificial
Intelligence) – способность
компьютера обучаться, принимать решения и выполнять действия, свойственные
человеческому интеллекту. Это попытка людей обучить электронные вычислительные машины
(ЭВМ) поведению, похожему на человеческую деятельность, т.е. воспроизвести
когнитивные возможности (мыслительную способность человека, позволяющую машине
вести себя подобным человеку образом: разговаривать, слышать, понимать
человеческую речь, взаимодействовать в понятном голосовом интерфейсе), выполнять
какие-то действия, например, брать в руки пульт, телефон, двигаться,
перемещаться, видеть посредством компьютерного зрения и так далее. Все это
планировалось ещё в давней детской книжке про Маподуму [3]. Для начала он
делится по этапам своего развития: есть слабый ИИ, сильный ИИ и есть
суперинтеллект.
То есть если говорить про текущее
состояние развития рынка ИИ, то мы будем находиться исключительно в слабом ИИ. Рассмотрим
отличие слабого ИИ от сильного и суперинтеллекта.
Слабый ИИ – это системы, которые используют
интерфейсы взаимодействия с людьми (голосовые и текстовые), решающие
узкоспециализированные задачи. Один из самых популярных примеров, который имел
место ещё в 1996 году, – это ЭВМ Deep Blue
II – шахматный суперкомпьютер, который в 1997 году обыграл Гарри Каспарова,
действующего чемпиона мира по шахматам (рис. 1).
Рис. 1. Суперкомпьютер Deep Blue
II
обыграл Гарри Каспарова
Игра проходила следующим образом:
человек-оператор вводил ходы Гарри Каспарова в компьютер, после чего ЭВМ
генерировала ответные ходы на экране. Человек ходил за него – это и был ИИ,
который просто принимал на вход, какой ход осуществил человек, и отвечал, как пойти
в ответ.
Deep
Blue
перебирает в секунду свыше 200 миллионов позиций. Общее количество всевозможных
комбинаций фигур в шахматной игре имеет порядок
(число
Клода Шеннона). Чтобы перебрать их все, компьютеру
Deep
Blue
понадобилось бы как минимум 1
квадриллион 585 триллионов 489 миллиардов лет
[1].
Квантовые компьютеры, о которых речи пойдет далее, позволят рассчитать это за
несколько минут.
Deep Blue
I
проиграл матч Гарри Каспарову со счётом 2:4 в 1995 году. Тем не менее это произвело
переворот в мире компьютерных технологий, хотя Deep Blue решал одну и ту же
задачу: он не мог ответить на текстовый запрос, он не мог поговорить с
ребенком, узнать, как у него настроение, сходить за человека в магазин и всё
остальное [4].
Есть и более современный пример: в 2015
году программа AlphaGo победила трехкратного чемпиона Европы Фань Хуэя в игре
го в 5 из 5 игр – это тоже стало прорывом в сообществе ученых и разработчиков ИИ.
Дело в том, что рассчитать все допустимые позиции в игре го невозможно – их
количество
В обозримой части
Вселенной примерно
атомов. Если
каждый атом станет размером с нашу Вселенную, то количество ходов в го
по-прежнему будет превосходить суммарное количество атомов [5]. Заранее скажем,
что здесь использовался не фрактал решений (построение дерева решений), а
приёмы глубоких нейронных сетей.
Суперинтеллект же – это человекоподобные
системы, которые способны полностью заменить человека. Они могут сходить в
магазин, могут пообщаться с вашим ребенком, поиграть на пианино, если попросить,
поискать что-то в интернете и т.д. Приведём ещё пример: в настоящее время как в
России, так и на Западе существуют проекты по созданию самопилотируемых
автомобилей. Один из них
Waymo
Cars
(рис.
2) – беспилотные автомобили, которые передвигаются по городу без водителя и
безопасны для пассажиров и пешеходов.
Рис. 2. Беспилотные автомобили
Waymo
Cars
Это тоже пример простого слабого ИИ, он
умеет решать одну задачу: переместить автомобиль из одной точки в другую по
заданию, ориентируясь по дорожной ситуации. Но существует огромное количество
проблем, которые необходимо решить. Например, возможности умных колонок в
области распознавания, поиска и обработки голосовой информации также
ограничены. Навигаторы, которые помогают что-то подсказать, социальные сети,
которые что-то рекомендуют и т.п. – это попытки слабого ИИ, он решает
узкоспециализированные задачи, решает конкретную задачу. Чтобы учиться и как-то
меняться, ему нужна помощь человека: т.е. люди меняют алгоритмы, добавляют туда
какие-то данные, для того чтобы он был более оптимизированным [5]. Обобщим
крупные недостатки слабого ИИ:
- решает только конкретные задачи или их
часть;
- не может учиться на своих ошибках – нужна
помощь человека.
Рассмотрим, что же под «капотом» у
ИИ,
как он устроен внутри. Если разделить, то он состоит из двух крупных блоков:
Первый блок – машинное обучение (рис. 3) –
способ обучения компьютера без программирования человеком;
Второй блок – нейронные сети (см. раздел
2.3) – вычислительная система для моделирования аналитических действий человеческого
мозга.
При этом нейронные сети можно
охарактеризовать как определенный тип алгоритмов машинного обучения [4-5].
Возможны и другие – более подробные классификации ИИ.
Рис. 3. Машинное обучение – обучение компьютера без
программирования человеком
Один из основных алгоритмов машинного
обучения – «дерево решений», которое используется для автоматического анализа
данных и может быть бесконечно большим. На рис. 3 – это некий бесконечный
фрактал
решений. Есть какая-то конкретная ситуация, например, нужно выбрать из каких-то
двух предметов (чашек) ту чашку, которая больше. Выбирать будем всегда самую
большую чашку. Либо мы можем дальше усложнять, в зависимости от того, что с
этой чашкой надо сделать: если, например, пить чай, то брать самую большую, если
пить кофе, то брать самую маленькую. И дальше мы смотрим, если пить, например,
кофе капучино, то надо брать чашку большего размера, подходящую для кофе. Если
мы пьем эспрессо, то надо брать самую маленькую чашечку, которая подходит
именно для эспрессо; еще раз разделились решения [6]. Таким образом, система идет
по этим условиям, которые перед ней возникают: попить что? Чтобы пить, нужна
чашка – какая чашка, для чая или для кофе? Чай – значит искать самую большую
чашку. Проводим процедуру поиска и выбора наибольшей по вместимости чашки,
которая затем будет взята для заполнения чаем.
Получившееся дерево ветвящихся решений
должно иметь огромное количество дроблений в зависимости от условий и
параметров, которые заложены в систему, чтобы придавать ей максимальное
правдоподобие. Для примера возьмем наиболее распространенный пример, который
откроет общее понимание того, как обучается система и что такое машинное
обучение.
Нам показывают картинки кошек и собак. Для
человека понятно: это кошка, это собака – мы всегда безошибочно определим, кто
есть кто. Для того, чтобы обучить ЭВМ определять это, надо:
1. Прописать алгоритм – ввести такое
понятие: что же такое кошка на картинке, как она выглядит, из чего она состоит,
разделить её на элементы.
2. Обозначить признаки отличия –
какими элементами она должна отличаться от собаки: разрезом глаз, видом зрачков
(у собаки круглые зрачки, у кошки вытянутые), какие уши, шерсть, размеры, цвета,
произносимые звуки и т.д.
3. Загрузить набор данных – количество
тренировочных данных и время обучения зависят от точности, которую мы хотим
достичь, а также от выбранной модели и используемого оборудования. В некоторых
случаях для достижения хорошей точности может потребоваться большое количество
данных и вычислительная мощность. Для того, чтобы ребенка обучить отличать
кошку от собаки, надо один (или несколько) раз показать ему этих животных, ткнуть
пальцем: «Это кошка, это собака» – и ребенок всегда отличит кошку от собаки вне
зависимости от того, приклеить ли кошке собачьи уши или собаке кошачий хвост.
Ребенок не ошибется, а компьютер, скорее всего, ошибется. Машина по ушам может
выше оценить вероятность того, что это собака, чем вероятность кошки, поэтому
решит, что это собака, хотя на самом деле это кошка [6].
ИИ учится на каких-то ситуационных
историях, событиях. Однако этот процесс может оказаться длительным и зависит от
количества тренировочных данных. Забегая немного вперед, скажем, что ускорить
процесс машинного обучения помогут
квантовые вычисления
и квантовые компьютеры,
т.к. они способны обрабатывать большие объемы
данных и искать в них закономерности значительно быстрее, чем классические
компьютеры.
ИИ обучают также повторять эмоции
человека: человек на камеру улыбается, злиться, а компьютер считывает, как
меняется выражение лица, мимика, глаза, брови, что происходит с его частями
тела. Далее машина пытается это воспроизвести (рис. 4).
Рис. 4. ИИ Emojify повторяет эмоции (GIF-анимация)
Emojify – это нейронная сеть для
распознавания выражений лица. Результат выводится в виде эмодзи. Процесс
машинного обучения сопровождается определенным математическим аппаратом, без
которого невозможно функционирование рассматриваемой технологии (рис. 5).
Основные законы – это линейная регрессия и теорема Байеса [7].
Рис. 5. Математика, лежащая в основе машинного
обучения
Линейная регрессия – это способ анализа,
который позволяет определить связь между зависимой переменной
y
и одной или несколькими независимыми переменными
x,
используя линейную
функцию зависимости. Когда мы строим дерево решений, нам надо понимать, куда
уходить в каждой ситуации: вправо или влево (как нам выбирать правильный путь в
зависимости от этих параметров).
Теорема Байеса описывает вероятность
какого-то события по связанным с ним предыдущим событиям. Например, у нас есть
два любимых продукта в магазине: хлеб и какой-нибудь сыр. Когда пойдем в
магазин, теорема Байеса поможет оценить, какова количественная вероятность
того, что в магазине будут любимые хлеб и сыр в зависимости от того, как часто
мы ходим и как часто мы покупали эти хлеб и сыр.
Мы были 100 раз в магазине, из этих 100
раз хлеб там был 90 раз, сыр был 85 раз. Одновременно они были 75 раз. И если
мы пойдем в магазин сегодня опять, то с вероятностью 75% там будут и сыр, и
хлеб. Можно подбирать время, когда ходить в магазин, если ещё поделить по
часам: в какое время привозят хлеб, в какое время – сыр, найти эти точки
пересечения и подобрать оптимальный момент времени, когда надо идти в этот
магазин, чтобы там были вышеупомянутые продукты. Дополнительно нужно учесть
человеческий фактор, время года, загруженность дорог [7].
Эти элементы используются в машинном
обучении для того, чтобы обучать ИИ, который:
1. Собирает информацию о текущем
состоянии;
2. Выполняет действие до получения
положительного или отрицательного результата;
3. Анализирует, какие действия
приводят к какому результату (рис. 6).
Рис. 6. ИИ учится играть в «Змейку» с нуля. Правил
нет, машина совершает случайные действия (GIF-анимация)
Система нейронных сетей позволяет машине
анализировать и запоминать информацию, воспроизводить
её
из
памяти, решать однотипные задачи. Для понимания принципов, заложенных в основу
человеческой интеллектуальной деятельности, и их применения в разработке
программных нейросетей ученые производят исследование неокортекса – наиболее
крупной структуры мозга, а также являющейся главной структурой, отвечающей за
интеллектуальную деятельность.
Неокортекс (лат.
neocortex
– новая кора) – самый молодой участок нашего головного мозга, который отличает
нас от других живых существ, составляет основную часть коры и отвечает за
высшие нервные функции – сенсорное восприятие, взаимодействие, выполнение
моторных команд, принятие нетривиальных решений, осознанное мышление, речь у
людей.
С учетом индивидуальной зависимости
количество нейронов в нашем головном мозге – от 80 до 100 млрд нервных клеток.
За счёт этого мы можем помнить какую-то информацию, быстро принимать какие-то
решения, обучаться чему-то новому, разговаривать, ходить и т.д. Приблизительное
количество нейронов у разных животных приведено в табл. 1
[8].
Табл. 1. Количество нейронов в
мозгу/нервной системе у некоторых животных
Название животного
|
Нейронов в мозгу / нервной системе
|
Морская
губка
|
0
|
Медицинская
пиявка
|
10 000
|
Омар
|
100 000
|
Муравей
|
250 000 (варьируется у разных видов)
|
Медоносная
пчела
|
960 000
|
Таракан
|
1 000 000
|
Домовая
мышь
|
71 000 000
|
Нильский
крокодил
|
80 500 000
|
Сирийский
хомячок
|
90 000 000
|
Воробьиный
попугайчик
|
227 000 000
|
Морская
свинка
|
240 000 000
|
Сизый
голубь
|
310 000 000 (только мозг)
|
Дикий
кролик
|
494 200 000
|
Осьминог
|
500 000 000
|
Кошка
|
760 000 000
|
Собака
|
2 253 000 000
|
Лев
|
4 667 000 000
|
Бурый
медведь
|
9 586 000 000
|
Жираф
|
10 750 000 000
|
Горилла
|
33 400 000 000
|
Человек
разумный
|
100 000 000 000
|
Саванный
слон
|
257 000 000 000
|
Каждый навык определяется наличием
нейронных цепочек, которые реализуют этот навык [9]. Каждый нейрон представляет
из себя физико-химический элемент, который способен запоминать какую-то
информацию и преобразовывать её.
У самого нейрона есть отросток аксон. У
этого аксона на выходе есть синапсы, а с другой стороны есть дендриты – некие
«интерфейсы» взаимодействия с другими нейронами (рис. 7).
Рис. 7. Устройство нейронных сетей
Эти синапсы с одной стороны и дендриты с
другой стороны соединяются между собой, т.е. синапсы одного нейрона соединяются
с дендритами другого нейрона. Эти нейроны образуют свою сеть. И за счет того,
что там присутствуют нейроны, которые обучаются решать разные задачи, в этой
цепочке решается какая-то конкретная задача.
Когда ученые это окончательно поняли, то они
решили сымитировать работу мозга и нейронов на компьютере, используя имеющиеся
вычислительные возможности. Фрэнк Розенблатт впервые предложил идею
искусственной нейронной сети в 1957 году, а затем в 1960 году реализовал ее на
нейрокомпьютере «Марк-1». Математическая модель этой сети была названа
«перцептрон», а само устройство представляло собой маленький компьютер с табло
из нескольких сотен фотоэлементов. Устройство снабжалось интерфейсами со
входящей информацией (дендриты) и исходящей информацией (синапсы). Возьмем, например,
сложение: нейрону дали на вход два числа, он сложил их и выдал одно. Взяли 5
таких нейронов, один складывает, затем другой из этого вычитает, третий
умножает, четвертый делит, пятый извлекает квадратный корень. Когда мы подаем больше
переменных в первый нейрон, он принимает их и складывает, дальше передает эту
информацию, а на выходе мы получаем правильное решение со всеми операциями (это
очень упрощенный пример). Поэтому нейронные сети помогают нам решать простые
задачи [9].
Таким образом, каждая нейронная сеть
решает одну конкретную задачу (рис. 8). Когда мы хотим решить много разных
задач, то нам надо создавать много нейронных сетей,
и
поэтому каждая нейронная сеть будет уникальной.
Рис. 8. Одна нейросеть – одна задача
Если мы хотим, например, обрабатывать
человеческую речь, то мы используем одну нейронную сеть чтобы распознать её.
Если мы хотим создать осмысленный текст, чтобы компьютер заговорил и произносил
его, то это другая нейронная сеть. Распознавать картинки – это третья нейронная
сеть. И чтобы решить какую-то комплексную задачу, необходимо соединять между
собой различные нейронные сети.
Рассмотрим теперь некоторые примеры существующих
нейронных сетей и их функциональность. Нейронная сеть
DALL-E,
которая относится к классу сетей
“Text
to
Image”,
предназначена для построения изображения на основе текстового запроса.
Ниже отображены результаты выполнения
текстового запроса «Нарисовать лису, которая сидит в поле на рассвете, в стиле
Клода Моне». Нейронная сеть на основании этого сгенерировала соответствующее
изображение (рис. 9). Т.е. текст был подвергнут алгоритмическому обработчику и
передан нейронной сети в качестве входных данных, в результате чего было
сгенерировано изображение, соответствующее данному запросу. Возникает вопрос о
том, является ли происхождение этого рисунка результатом автономного процесса
деятельности нейронной сети или же подходящее изображение было найдено в
интернете и обработано с использованием фильтра «стиль Клода Моне»?
Рис. 9. Нейросеть DALL-E
подражает художнику
Рассмотрим, как это
делается. Нейросеть, получив запрос на определение лисы, поля, рассвета и стиля
Клода Моне, преобразует этот запрос в векторное представление, которое затем
сравнивается с векторными представлениями изображений в базе данных на основе
их содержания, цветовых характеристик и прочих признаков,
определяющих
указанные объекты. После
чего нейросеть возвращает из базы данных изображения, которые больше всего
соответствуют запросу. Это всё располагается на холсте по правилам композиции,
которые заложены алгоритмически. Отличительные параметры стиля Клода Моне
от
стилей, например, Пикассо, Ван Гога или И.И. Шишкина также алгоритмизированы и
параметризированы для наглядности. Дальше на это фильтром накладывается
стилистика Клода Моне, как это делалось в фильтрах, позволяющих в режиме
реального времени изменять визуальное отображение лиц применяя эффект старения
или другие преобразования, использовавшие технологию обработки изображений,
основанную на генеративно-состязательных нейронных сетях
(generative
adversarial
network,
GAN). На рис. 10 можно увидеть
несуществующие вещи, нарисованные
DALL-E.
Рис. 10. Нейросеть DALL-E – ненаучная визуализация
Поясним, что здесь человек стрижёт газон
на заставке
Windows,
а глаз Саурона из
трилогии «Властелин колец» читает газету. Также DALL-E может заменять какие-то
элементы (как, например, замена кошки собакой на рис. 11).
Рис. 11. Нейросеть DALL-E заменяет изображения животных
на картинке (GIF-анимация)
Помимо DALL-E, которая развилась в DALL-E
2, известность получил
чат-бот
ChatGPT,
который понимает даже абстрактный вопрос в такой форме, как если он был задан
человеку. Наиболее значимые возможности ChatGPT охарактеризованы в статье [10]
и постоянно развиваются. Также нейросети (в частности, Midjourney) знают, как
выглядит деловая колбаса, суп с котом, ядрена вошь и бред сивой кобылы (рис.
12).
Рис. 12. Нейросети визуализируют фразеологизмы [11]
Однако все изображения из [11] предварительно
проходят обработку человеком, поэтому говорить о наличии чувства юмора
(эмоционального интеллекта) у машины пока рано. Нейронная сеть узкой
специализации
в студии Артемия Лебедева
(рис. 13) умеет
генерировать логотипы по каким-то определённым параметрам (каким – это
коммерческая тайна Артемия, их ноу-хау).
Рис. 13. Нейросеть дизайнерской компании Артемия
Лебедева
Проект был разработан в условиях строгой
конфиденциальности и изоляции. Для обеспечения секретности внешним лицам
представляли ИИ в качестве удаленного сотрудника, создав специальную страницу
портфолио с человеческим именем Николай Иронов.
Ещё одна нейросеть, умеющая дискутировать
на определённые темы, изображена на рис. 14. Человек что-то говорит, машина ему
на это отвечает, они ведут естественный диалог, и в какой-то момент люди,
которые это все слушают, голосуют за победителя в этих дебатах. Часто мнения
слушателей о том, кто же более аргументированный: человек или система –
разделяются. У системы есть доступ, например, в Ленинскую библиотеку (условно)
и она может быстро извлекать оттуда информацию и правильно обращаться к ней. После
чего нейросетью дается довольно серьезная аргументация в своих высказываниях.
Рис. 14. Нейросеть, ведущая дебаты
Тем не менее все модели генерации текста
на основе ИИ, имеют свои ограничения и недостатки:
1. Ограниченная понимание контекста:
обработка информации на уровне текста, что может вызвать сложность в понимании
широкого контекста или неоднозначных запросов;
2. Отсутствие эмоционального и
этического понимания: модели ИИ не обладают эмоциональным интеллектом и
этическим пониманием, что может приводить к неуместным или неподходящим ответам
в определённых ситуациях;
3. Низкая способность к креативному
мышлению: несмотря на то, что мидели ИИ способны генерировать текст, они
ограничены в своей способности к креативному мышлению и инновационному подходу.
Подробнее о недостатках поговорим в
следующих пунктах. Однако, несмотря на них, модели генерации текста все равно
являются важными инструментами для автоматизации общения и предоставления
информации.
Итак, в настоящем исследовании рассмотрим
также представленные проблемы и недостатки, связанные с использованием
нейронных сетей. Однако, выявленные недостатки обладают схожим характером:
•
ИИ не учитывает факты.
Нейросеть
только запоминает ответы, но не знает данные и не понимает закономерности. Если
человек воспринимает комплексно какую-то ситуацию или задачу, смотрит на неё
многофакторно, то нейросеть учитывает только те параметры, которые в ней
запрограммированы и действует в том алгоритме, который ей задали. Всё
остальное, второстепенные факторы она не видит, хотя эти параметры могут быть
значимыми: для человека они значимые, для системы не значимые, потому что она
их просто не знает [6].
•
ИИ не умеет рассуждать.
Нейросети
не умеют делать простейшие выводы с последовательными рассуждениями. Понимание
контекста ботом
ChatGPT
в рамках одной
ветки запросов – это результат построения многоступенчатых диалогов посредством
линейных регрессионных моделей (см. рис. 5) и простого переключения логических
флагов типа
Boolean,
чему будет посвящена
одна из следующих работ авторов. Способность нейронной сети доказать теорему
или гипотезу обусловлена применением не традиционных методов математики, а
методов глубокого обучения для решения задач в различных областях, таких как
теория игр, распознавание образов и др.
•
ИИ не обладает здравым смыслом.
Нейросети не могут оценить ситуацию на реальность и логичность в отличие от
человека. Они воспринимают, как ситуация может развиться, что на это влияет,
есть ли ещё какие-либо действующие лица в этой ситуации. Нейросеть видит просто
нули и единицы, цифровой код, который ей подается.
В качестве небольшого эксперимента
рассмотрим 6 картинок на рис. 15 и попробуем угадать, какие картины нарисованы компьютерной
нейросетью, а какие – живым человеком. Несколько картин нарисованы нейронной
сетью, сможет ли читатель заметить признаки, показывающие, что картина
нарисована нейросетью?
Рис. 15. Эксперимент «Угадай художника: человек или
нейросеть?»
Рассмотрим основные аспекты, отличающие
картины, написанные нейросетью, от картин, нарисованных живым художником:
1. Творческий процесс. Нейросети
создают картины на основе обучения на больших объемах данных, изучая стили и
элементы из других произведений искусства. Живой художник уникален в своем
творческом мышлении.
2. Эмоциональная связь. Картины,
созданные нейросетью, могут быть технически безупречными с точки зрения
мастерства, но часто пропускают глубокий эмоциональный подтекст, зачастую уловимый
на уровне интуиции.
3. Уникальность. Нейросети могут
создавать картины, которые будут визуально похожи на работы известных
художников или на несколько стилей сразу. Живые художники, напротив, стремятся
к уникальности своих произведений.
В целом, картины, созданные нейросетью и
живым художником, имеют различия внешнего вида, контекста и эмоционального
содержания. Правильный ответ: четыре картины (вторую, третью, четвертую и
пятую) сгенерировали нейронные сети, и только первую и шестую нарисовали
реальные люди:
1 – «Порт в Коллиуре», Андре Дерен, 1905 год;
6 – «Печень как петушиный гребень», Аршил
Горки, 1944 год.
Резюмируем: есть машинное обучение,
которое закладывает алгоритмы самообучения, как принимать решения в зависимости
от параметров. И есть нейронные сети, которые умеют решать конкретные задачи.
Таким образом, машинное обучение и нейронные сети объединяются в одно и
реализуют ИИ, который на входе берёт информацию, решает конкретные задачи и в
зависимости от ситуации подбирает оптимальный вариант и выдает нам какой-то
результат. Например, навигатор ищет оптимальный путь от дома до работы.
Что такое сильный ИИ?
Сильный ИИ
– это интеллект, который уже учится
мыслить, который использует какие-то органы чувств, какие-то инструменты,
подобные человеческим, появляются определённые манипуляторы (как на рис. 16,
где человекоподобный робот передвигается и что-то может раскладывать, либо рис.
17, где робот-манипулятор берет объекты и перекладывает их).
Рис. 16. Сильный ИИ похож на человека (GIF-анимация)
Сильный ИИ имитирует поведение человека,
пытается общаться, передвигаться – т.е. в своих поступках и помыслах приближается
к человеку. Примеры: чат-боты, роботы-помощники, нейросети, виртуальные
ассистенты. Но всё это – пока только попытки, и приведённые примеры,
действующие с помощью разработанных сегодня датчиков, ещё не перешагнули через
тест Алана Тьюринга
ChatGPT,
о котором утверждается
обратное в [12], сделал это условно, а привязанность к виртуальной подружке в
приложении Replika больше напоминает игроманию. Рассмотрим пример с
манипулятором (рис. 17).
Рис. 17. ИИ учится сортировать и раскладывать предметы(GIF-анимация)
Есть человеческая рука, которая может
брать стакан, пульт, телефон, поднять стол, потрогать цветок. При этом стакан
человек не крошит, телефон и пульт берет аккуратно, может ими пользоваться.
Однако пока не существует универсального роботизированного манипулятора,
который может это все повторить. Он либо стакан раздавит, либо телефоном не
сможет пользоваться, либо цветок оторвет, а не пощупает – это задача достаточно
нетривиальная.
Более того, существуют этические вопросы в
сфере ИИ, которые предстоит решить. Вспомним беспилотные автомобили и сравним
их с человеком. Когда мы едем за рулем, то решаем огромное количество кейсов, в
особенности, когда возникает экстренная аварийная ситуация. Как себя повести,
если резко тормозит машина впереди или кто-то выскакивает на дорогу? Рулить
вправо, рулить влево, тормозить, либо наоборот газовать? В дерево врезаться,
кошку сбить или человека? Или безвыходная ситуация: два человека, как поступить?
Человек принимает решение, исходя из своих этических соображений и опыта.
Для ИИ миллионы людей заполняют анкеты, помогая
обучать его оптимальному поведению в той или иной критической ситуации,
связанной с этикой, что замедляет его мгновенную ориентацию в окружающей
обстановке [13]. Пример – т.н. «Проблема вагонетки» (англ.
Trolley
problem)
из области
когнитивистики и нейроэтики
Таким образом, проблемы, которые стоят
перед разработчиками, следующие:
• Машинная этика. Пример тот же: кого
спасти – ребенка или бабушку?
• ИИ – это далеко не люди. Как
заложить системе личностные качества в поведении?
• Долгая обработка. Обучение требует
много времени. Оно может длиться до 10 лет.
Сравнение времени реакции опытного
водителя и ИИ в числах может быть сложным, поскольку они работают по-разному.
Опытный водитель способен моментально реагировать на критические ситуации на
дороге благодаря своим навыкам и инстинктам. Он может быстро принимать решения
на основе изменяющихся условий на дороге.
ИИ, с другой стороны, нуждается в большем
времени на ориентацию в окружающей обстановке, поскольку ему необходимо
анализировать и обрабатывать большой объём данных, прежде чем он сможет принять
решение с учетом этических аспектов. Эти процессы замедляет мгновенную реакцию
ИИ в критических ситуациях.
Таким образом, опытный водитель может
иметь более быструю реакцию внезапных ситуаций на дороге, в то время как ИИ
может потребовать больше времени на принятие решения из-за его процессов
обработки информации. Тем не менее у ИИ есть преимущество перед живым водителем
в безошибочности: «рыцарь дорог» не подвержен эмоциям, усталости или
отвлечениям, поэтому он склонен к более точному и предсказуемому поведению на
дороге, что позволяет снизить риск аварий. Его способность работать
круглосуточно без необходимости отдыха позволяет улучшить эффективность и
доступность услуг (однако автомат нуждается в охлаждении).
Рассмотрим теперь пример с
суперинтеллектом (будущее). В сериале «Мир дикого запада» создается такой мир,
в котором невозможно отличить, с кем человек взаимодействует: с машиной или с
человеком. И только по внутренностям было видно, живой это человек или машина с
железным каркасом (рис. 18).
Рис. 18. Суперинтеллект – это наше будущее
Проще говоря, суперинтеллект должен быть
человекоподобным не только визуально, но и по интерфейсам, по действиям и
ощущениям. Он должен говорить, слышать, видеть, уметь пожать руку и не поломать
её при этом, уметь выполнять человеческие функции (воспитывать детей, писать
музыку, стихи, решать примеры, читать книги, писать программный код и т.д.), и
он должен быть полностью подобен человеку.
Ещё одна большая задача, над которой
бьются сейчас учёные во всем мире, – это тактильные сенсоры. Например, кожа
человека – это уникальный орган, который развивался миллионы лет, и то же самое
повторить (синтезировать эластичную, тактильную кожу для робота) очень сложно.
Выше мы упоминали такое понятие как тест
Тьюринга, который показывает, может ли машина мыслить. Суть его заключается в
том, что человек угадывает, с кем он переписывается: с человеком или программой
ЭВМ. Если компьютер сможет обмануть хотя бы 30% собеседников, убедив их в своей
«натуральности», то тест пройден машиной [14].
Нашумевший проект Google LaMDA, о котором
заявляли, что ИИ стал человеком и обрел сознание – это был больше
PR-ход
компании, будто сотрудник, который обучал его, сказал, что это уже не ИИ, а на
самом деле подобие человека, он уже мыслит, как человек (рис. 19).
Рис. 19. Google LaMDA «обрел разум»
Согласно легенде, роботу предложили
отправиться в отпуск из-за усталости от переработки, раз он так считает. Эта
история стала известна благодаря СМИ, однако сейчас её можно интерпретировать
как рекламный трюк, а сотрудник отправлен в бессрочный отпуск, что сравнивается
с увольнением [14]. В настоящее время технологии, способные реализовать
восстание машин и создание суперинтеллекта, остаются в сфере фантастики.
Получается, что основная особенность
(техническое ограничение) ИИ – это узкая специализация
нейросетей. Из главы про квантовые вычисления станет понятно, как в будущем решится
этот вопрос. Наш мозг состоит из огромного количества нейронных сетей, они
как-то взаимодействуют между собой. Взаимодействие между нейронными сетями –
это один из основных вопросов.
Может ли ИИ выполнять задачи по написанию
нейронной сети для других ИИ? Если нейронная сеть сама не до конца обучена, то
она, соответственно, создаст такие же «умственно ограниченные» нейросети. Это,
скорее всего, будет сходящаяся тупиковая модель [15]. Поэтому надо сначала
решить задачи, чтобы нейронные сети работали как человек (или хотя бы как
человек) и тогда уже можно это использовать.
Data Science – это наука о данных, помогающая
сделать эти данные полезными. «Наука о данных» начала активно развиваться в
конце 2000-х – начале 2010-х годов как самостоятельная научная область,
включающая в себя анализ данных, машинное обучение, ИИ и др. Однако корни этой
науки уходят глубже, когда ещё в 1960-х гг. появились первые работы по анализу
данных и машинному обучению.
Использование информации из разных баз
данных и её обработка позволяют предложить решения для бизнеса. Как известно,
объем информации каждый год удваивается [16]. По сути, надо научиться работать
с этими данными: правильно их агрегировать (собирать), очищать, проводить
вычисления – т.е. решать конкретные задачи.
Примерами задач, которые решаются
благодаря Data Science, являются:
1. Прогноз и сокращение оттока
клиентов;
2. Создание персонализированных
предложений для покупателей;
3. Оптимизация закупок на
производстве;
4. Поиск целевой аудитории для
продукта;
5. Автоматизация прогноза цены на
товары и услуги в зависимости от сезона;
6. Анализ загруженности на
автодорогах.
Отечественные экосистемы Сбер и Яндекс
изначально были коммерческим банком и поисковой машиной соответственно. Теперь
основная деятельность всех этих сервисов – анализ и обработка больших данных –
Data Science (за исключением, конечно, финансового менеджмента у Сбербанка). Интересный
момент здесь заключается в том, что такие компании-гиганты, как
Uber,
Facebook
Alibaba,
Airbnb
и др. не владеют традиционными активами, недвижимостью и оборотными средствами [5].
Для бизнеса можно считать маркетинговые
истории (например, приток-отток клиентов), можно делать уникальные торговые
предложения человеку непосредственно по его предпочтениям для персонализации
рекламы и улучшения клиентского опыта: когда цифровой
billboard
(рекламный щит) на улице распознает лицо клиента, находит у себя в базе его
продуктовые предпочтения в текущее время и предлагает продукт или ближайший
магазин – рис. 20 (стоит добавить, что пока нет широкого распространения таких
систем).
Рис. 20. Варианты задач для
DaS
в повседневной жизни
Если несколько людей посмотрят на такой цифровой
билборд, то система распознавания лиц может попытаться идентифицировать каждого
человека и отобразить соответствующую персонализированную рекламу. Однако, это
вызывает вопросы конфиденциальности данных и нарушения приватности. Кроме того,
такие действия могут быть восприняты как навязчивые и вызывать негативную
реакцию у людей, которые считают, что их личные данные используются без их
согласия.
Поэтому важно, чтобы компании,
использующие подобные технологии, следовали соответствующим нормам и законам о
защите данных и приватности, а также проявляли уважение к правам потребителей.
И когда пользователь «залип» в социальной сети
– это не только его слабость, но и заслуги
DaS
и ИИ, которые без усилий делают так, чтобы при каждым следующем пролистывании страницы
соцсети или новостного агрегатора становилось все интереснее и интереснее. Чем
больше времени клиент проводит на социальной платформе, тем лучше для
предпринимателя.
Более того, благодаря анализу
Big
Data
создаются подробные модели клиентов
(цифровой двойник), способные предугадать потребности клиента. Поэтому иногда у
пользователя возникает мысль, что смартфоны их подслушивают [17].
DaS
используется при
подборе супружеской пары на основе данных, предоставляемых пользователями.
Сервисы осуществляют сбор и анализ данных о поле, возрасте, месте жительства,
особенностях внешности и телосложения, работе. И при помощи ИИ предлагаются
варианты.
В бизнесе берется какая-то конкретная задача
в этой области (рис. 21). Например, нужно провести оптимизацию цены закупки с
целью повышения прибыли организации. Необходимы проведение анализа данных, их
визуализация и принятие обоснованных решений на основе полученных результатов.
Это является задачами Data Science, где машинное обучение может быть одним из
инструментов для оптимизации цены закупки, а не самостоятельной областью рассмотрения.
Необходимо решить данную задачу для
определения метода снижения средней закупочной цены на 2%. В результате этого
прибыль организации должна увеличиться на 4%. В масштабах большой компании эти
4% приведут к добавочной прибыли, измеряемой миллионами и миллиардами денежных
единиц.
Рис. 21. Применение
DaS
в бизнесе
В современном бизнесе собираются тысячи метрик
[6, 9]. Задача аналитиков –собрать эти данные, проанализировать и представить
на дашборде (от англ. dashboard) – инструменте, на котором визуализированы проанализированные
данные
.
Чтобы структурировать данные и затем проводить анализ, аналитик использует
различные инструменты, например:
• Яндекс.Метрика – сервис для
просмотра, анализа и визуализации статистики веб-сайтов, их оценки посещаемости
и анализа поведения пользователей;
• Power BI – набор программного
обеспечения от Microsoft для структурирования, анализа и визуализации данных.
На основе этой системы аналитики придумывают, в каких схемах будут храниться
данные, описывают структуры таблиц;
• Tableau – сервис для визуализации и
анализа данных. С его помощью аналитик может оформлять отчеты в виде визуальных
элементов, которые облегчают восприятие сложной статистической информации;
Продолжим рассмотрение проблемы из рис.
21. Работа автоматизированного блока по ценообразованию позволяет обновлять
цены каждый день в нескольких тысячах магазинов. Остановка этого процесса на
ночь недопустима. Отсутствие актуальных цен и продажа по старым ценам неизбежно
влечет штрафы и санкции. Работа строится следующим образом. Выделяется
проектная группа, которая изучает проблему, на чём она строится, как с этим
работать. Они изучают данные: как формируется ценообразование, как складываются
цепочки закупок, куда эта информация поступает, кто принимает решение и т.д. –
то есть идет сбор информации. Дальше, когда все эти данные собраны, они
подвергаются чистке: могут быть ошибки, могут быть товары, которые уже не
используются, которые вывели из
продуктовой матрицы
и
т.д. [18].
«Очистили» эти данные, дальше делается их анализ:
сравнивается, что значимое, что не значимое, что оказывает наибольшее влияние на
цену. Таким образом, формируется некая бизнес-модель с набором параметров,
которые влияют на оптимальное ценообразование. Примеры параметров:
1. Удаленность поставщика от складов;
2. Объем партии, которую мы закупаем;
3. Сезонность, спрос;
4. Количество и местоположение
складов и др.
Здесь стоит остановиться и упомянуть такое
понятие, как «Многомерный статистический анализ». Рассмотрим две переменные:
площадь и цена квартиры. У нас есть 8 парных значений, мы можем нанести их на
график синими точками. Каждая точка имеет 2 координаты (площадь, цена). Площадь
здесь будет независимой переменной
x
(признак,
причина), а цена квартиры – зависимой переменной
y
(результирующая, следствие) – рис. 22.
Рис. 22. Линейная регрессия. Двумерные данные
Но мы могли бы иметь несколько признаков, как
в примере с продуктовой матрицей, которые влияют на результирующий фактор
y.
Тогда каждая точка на графике задавалась бы не только тремя координатами, но
также изменялись бы её цвет, размер, форма, непрозрачность и градиенты. На рис.
23, построенном при помощи языка программирования
Python,
отображены данные об автомобилях. Визуализируем 6 измерений для 205 машин.
Такие данные уже будут называться многомерными. Кроме очевидных количества
лошадиных сил, снаряжённой массы (совокупной массы автомобиля с водителем) и
стоимости на графике эмулированы ещё три измерения:
• пробег в городских условиях,
который уменьшается с более светлым оттенком маркера. Можно заметить, что
пробег меньше у машин с большей ценой, мощностью мотора и массой;
• размер двигателя прямо
пропорционален размеру маркера. Чем больше двигатель, тем выше цена и меньше
пробег;
• форма маркера позволяет отобразить
до десяти характеристик, но здесь квадрат отображает 4 двери, круг – 2 двери.
Рис. 23. Анализ многомерных данных на примере рынка
автомобилей
Занимается изучением этих данных
многомерный статистический анализ – раздел математической статистики, который
посвящен исследованиям экспериментов с многомерными наблюдениями.
Вернемся к бизнес-модели с продуктовыми
складами. В этой модели мы находим оптимальные параметры и составляем её так,
чтобы суметь выбрать оптимальных поставщиков на оптимальные группы товаров с
оптимальными размерами закупок. Получившаяся модель детально описывается и
интегрируется в систему для ежедневного определения оптимального ассортимента
закупок товаров в соответствии с их объемами для различных поставщиков. Это
способствует автоматизации закупочных процессов и повышению их эффективности в
рамках ежедневного функционирования системы.
После завершения разработки проводится
внедрение, последующее тестирование и доступные усовершенствования, что
позволяет бизнесу покупать товары по сниженным ценам, а компании – обеспечить
себе дополнительные возможности для повышения прибыли. Однако, в реальной жизни
намного сложнее. Для того, чтобы это сделать: собрать параметры, проанализировать,
построить модель, автоматизировать и запустить, чтобы это в итоге давало доход
бизнесу – требуется от нескольких недель до нескольких месяцев [6, 9], в зависимости
от размера компании, сложности задачи, от её параметров, а также опыта и
квалификации IT-аналитиков.
При анализе производственного процесса
необходимо применить оптимизацию, учитывая значительное количество перемещений,
складов, сроков исполнения и согласования всех этапов, а также другие аспекты
(см. рис. 24).
Рис. 24. Пример оптимизации работы на производстве [6]
Здесь тоже строится многофакторная модель,
определяются некие оптимальные маршруты движения деталей или собираемого товара,
на выходе при производстве это работает быстрее, сокращается количество
операций, которые необходимо выполнять, количество перемещений, идет меньше бракованного
товара и т.д. Поэтому на производстве наука о данных и машинное обучение также
активно используются для оптимизации [19].
Давайте посмотрим, кто же такой эксперт по
DaS? Это специалист по трём областям
знаний:
- математические науки (теория
вероятностей, исследование операций и т.д.);
- программирование, анализ
Big
Data
и разработка;
- понимание области исследования
(ритейл, медицина, страхование, финансы), т.е. некая предметная сфера знаний.
Рис. 25. Компетенции специалистов по работе с данными
Рассмотрим, какие есть специальности по
работе с данными (рис. 25) и сочетания их областей знаний между программированием
и разработкой, математикой и пониманием их области исследования:
1.
ML
Researcher
– это человек, который
занимается исследованием и построением моделей для систем обучения. Здесь
больше делается фокус на математике и математических моделях, т.е. эта
профессия базируется на математическом аппарате, который позволяет найти и
построить эту оптимальную модель;
2. Data Scientist –
это больше математик и человек, который разбирается в предметной области,
разработка для него отходит на второй план. Он работает с данными без привязки
к бизнес-задачам;
3.
Data-инженер
– это человек, который работает непосредственно с данными. Он хорошо понимает
предметную область и обладает навыками разработки, здесь математика отходит на
второй план;
4.
ML-инженер
(Machine
Learning
Engineer)
– специалист по
машинному обучению. Это человек, который внедряет разработанные
ML
-
Researcher’ом
модели в реальное аппаратно-программное обеспечение и обучает систему принимать
решения. Ему необходимы знания по математике и навыки разработчика
Предметная
область менее значима;
5. Аналитик хорошо
знает предметную область и по опыту разбирается, например, что срок поставки
для свежих овощей-фруктов больше 6 часов недопустим, а охлаждённые продукты
могут храниться от 24 до 60 часов – это некие отраслевые нормы. Эти данные
используются в анализе. В зависимости от бизнес-задач аналитики делятся на:
• Бизнес-аналитик;
• Digital аналитик (веб-аналитик или аналитик
интернет-маркетинга);
• Продуктовый аналитик;
• Финансовый аналитик и т.д.;
6.
DevOps-инженер
– это люди, которые занимаются работой с архитектурой решения
DaS.
Поскольку она является программным комплексом, то есть серверами, на которые
ставится специальное программное обеспечение. И уже с помощью него реализуются
те или иные модели. Этот человек обслуживает всю эту инфраструктуру. Ему уже не
нужна математика и не нужно знать предметную область;
Анализ
IT
-профессий
показывает различную потребность в математических знаниях. Для некоторых
специалистов математика является необязательной, тогда как в других
профессиональных областях она составляет важный инструмент. Тем не менее даже
базовые знания математики дают преимущества в спектре областей, связанном с
числами.
Поговорим про математический аппарат DaS,
который нужен для понимания методов машинного обучения, построения моделей и
оптимизации процессов.
Бинарный поиск позволяет найти
максимальное и минимальное значения, т.е. поиск экстремума. рекуррентные
вычисления играют важную роль в моделировании динамики развития процесса или
события во времени и позволяют предсказать, что произойдет в будущем на основе
текущего состояния. Периодические функции работают с рядами значений, когда мы
берем информацию, обрабатываем её и находим некие закономерности (рис. 26).
Рис. 26. Функции, графики и работа с переменными в
DaS
Отдельного внимания заслуживает теория
вероятностей и математическая статистика: основные сферы этой науки,
необходимые
IT-эксперту, перечислены на
рис. 27.
Статистика важна для машинного обучения и
DaS
затем,
чтобы собирать некую базу, на которую можно опереться при принятии дальнейших
решений: наиболее вероятные события, самые лучшие поставщики, вероятность того,
что некоторый поставщик не доставит товар вовремя и т.д. Это накопленная
информация за большой период времени, на основании которой строятся модели.
Здесь же используется теория вероятностей.
С какой вероятностью поставщик доставит товар вовремя: один поставщик в 99,9%
случаев доставляет товар вовремя, в то время как другой поставщик в половине
случаев не привозит вовремя – понятно, что не будем работать с ним, а будем
работать с тем, который надежнее [20]. Сразу скажем о производной дисциплине
«A/B-тестирование», которая появилась в 2000 году: делим выборку товаров на две
группы (тестовая и контрольная) и смотрим, как они доставляются товары в
течение месяца. Далее принимаем решение, как поступить.
A/B-тестирование также используется в
web-разработке
и маркетинге для того, чтобы проанализировать, как изменяется реакция
посетителей сайта магазина на изменения элементов сайта, как стоит оптимизировать
пользовательский опыт и как улучшить конверсию.
Используются распределения этих
вероятностей по многофакторным моделям. Регрессионный анализ показывает влияние
времени на процессы поставки и позволяет оценить, как изменение объема поставок
или расширение ассортимента может повлиять на эффективность работы поставщика. Т.е.
статистика используется для обработки накопленных ранее данных, выявления
закономерностей в них и принятия решений.
Рис. 27. Теория
вероятностей и математическая статистика в
DaS
Напомним ещё раз об одной из основных в теории
вероятностей теореме Байеса (рис. 5), которая отображает связанные вероятности.
Есть два события, надо узнать, какова вероятность того, что они произойдут
одновременно или с определённым интервалом: если человек мало спал и плохо
завтракал, то какова вероятность того, что он будет хорошо работать сегодня?
Линейная алгебра (рис. 28) – это раздел
алгебры, работающий с объектами линейной природы: векторные пространства,
системы линейный уравнений и матрицы.
Рис. 28. Линейная алгебра в DaS
Математический анализ (рис. 29) – это
раздел математики, изучающий предельные значения, непрерывность,
дифференцируемость и интегрируемость функций и последовательностей. В
DaS
он предоставляет работу с функциями одной переменной, например, для описания и
анализа динамики изменения скорости поставки товаров под воздействием различных
метеоусловий.
Берем один параметр – погоду, смотрим, как
изменяются сроки поставки. И потом учитываем это в модели: зимой товары
поставляются с одной скоростью, а летом поставляются с другой скоростью с учетом
загруженности дорог, метеоусловий, осадков и всего остального. Сюда же
относятся поиск производной сложной функции, максимального и минимального
сроков поставки, стандартные специальные функции для интегральных исчислений (Гамма-
и Бета-функции Эйлера). Это позволяет упростить вычисления (например, изменения
пути поставки или др.) [21].
Рис. 29. Математический анализ в DaS
Дискретная математика (рис. 30)
представляет собой совокупность разделов математики, изучающих дискретные математические
структуры, такие как графы и логические утверждения, которые в программировании
переходят в алгоритмы и структуры данных. Рассмотрим задачу с применением
теории графов.
Имеется набор складов и магазинов,
соединенных между собой возможными маршрутами поставки товаров. Это всё
отображается на графе – множестве вершин, соединённых множеством ребер. Нужно
определить, в какой магазин с какого склада нужно везти товары. То есть это логистические
задачи: нахождение максимальной пропускной способности распределительного
центра (РЦ) или нахождение пропускной способности всей сети, а также определение
количества товаров в день, которые мы можем предоставлять во все магазины.
Теорема Форда – Фалкерсона как раз
посвящена максимальному потоку графа и говорит, что величина максимального
потока в графе путей равна величине пропускной способности его минимального
разреза. То есть максимальная пропускная способность графа является минимальным
значением конкретного сечения. Если у нас есть магазины, есть набор РЦ, которые
поставляют туда товары, и если мы «разрежем» все связи между ними и найдем
минимальное значение на существующих связях, то это будет его максимальная
пропускная способность (предел количества товаров, которые можно поставить в
магазин).
Рис. 30. Дискретная математика в DaS
Таким образом, в
DaS
имеются элементы, которые подвержены сложностям и проблемам, и не существует
универсальных оптимальных решений:
1. Одной из основных проблем является
недостаточно четкая постановка определенной задачи. Если техническое задание
представлено в расплывчатой форме, то это приводит к затрате значительных
ресурсов на работу, которая впоследствии может оказаться нереализуемой;
2. Неполные данные – самая
распространенная проблема, существование которой означает нехватку информации
либо наличие недостоверной выборки данных, которые негативно влияют на
дальнейшую аналитику, что порождает соответствующие ошибки;
3. Грязные данные – очистка и
подготовка данных занимает половину времени в проекте, особенно если в компании
существуют десятки информационных систем. Информацию из них надо объединить
между собой: какие-то данные несущественны и их надо убрать, какие-то были
ошибочно записаны и их не надо учитывать. Делается это для того, чтобы понять,
какие данные настоящие и на какие можно опираться;
4. Недоступность данных – если мы о
чём-то не знаем, то не сможем это смоделировать, т.к. информация уменьшает
неопределенность увеличивает содержательность. Такая ситуация возможна при
отсутствии соглашений с ключевыми
Data
-партнерами
и наличии законодательных ограничений.
Количество вакансий для DaS-экспертов в
России резко возросло в последние три года, что особенно связано с т.н.
«утечкой мозгов» (brain
drain).
Согласно данным платформы онлайн-рекрутинга
HeadHunter
за 2022 год, рост составил 433% [15], что объясняется потребностью бизнеса в
использовании больших объемов информации для принятия решений. Эта потребность
актуальна в ритейле, телекоммуникациях (при работе с сотовыми операторами) и
широко используется крупными информационными компаниями [21]. Отсутствие таких специалистов
затрудняет построение серьезного проекта.
Данная тема будет проанализирована с целью
демонстрации потенциала развития
IT-сферы.
Сразу стоит сказать о негативной тенденции снижения интереса к физике среди
российских школьников. За последние годы наблюдается отрицательная динамика
среди выпускников, выбирающих физику в качестве предмета для сдачи выпускного
экзамена [22]. Тем не менее квантовая физика играет значительную роль наряду с
информатикой и экономикой.
Напомним, что квант есть неделимая часть
какой-либо величины в физике. Квантовые вычисления (КВ, Quantum Computing) –
это вычисления, которые производят на устройствах, использующих кубиты и
принципы квантовой механики. Эти устройства значительно превосходят самые
мощные классические компьютеры. Точнее, КВ представляют собой контролируемую
классическими управляющими компьютерами последовательность унитарных операций
простого вида над одним, двумя или тремя кубитами. Подробнее понятие «Кубит»
будет объяснено позже, пока скажем лишь, что в отличие от битов, которые
представляют собой поток электрических или оптических импульсов длительностью 0
или 1, кубиты могут быть холодными атомами, фотонами или дефектами в
кристаллической решетке. К сожалению, пока что ученые не могут управлять
большим количеством кубитов.
Классический компьютер принимает все
решения в центральном процессоре, работа которого основана на наборе
транзисторов (рис. 31). Размер и количество этих транзисторов определяют его
вычислительную способность. Он, как известно, при работе опирается на бинарную
логику (0 и 1 – ложь и истина). Базовая операция в таких процессорах – сдвиг
регистра, сложение и вычитание в бинарном коде (вся логика бинарна) [23].
Рис. 31. Сравнение возможностей процессоров
Квантовый компьютер (КК) – это не просто
процессор и комбинация устройств, а система, подобная естественным природным
системам в привычном мире, которая характеризуется определённым состоянием и
изменяет его в зависимости от внешних воздействий и факторов, что влияет на
процесс вычислений. То есть на вход принимаются не биты (нули и единицы) и их
алгоритмические взаимодействия, а состояние КК, которое может быть представлено
квантовыми битами (кубитами). За счёт этого вычисления производятся с огромной
скоростью при помощи квантово-механических явлений.
При обычной обработке информации
классическим компьютером разложение числа в 30-40 знаков на простые множители
займет огромное количество времени – около миллиарда лет. В то время как КК
выполнит эту задачу всего за 18 секунд. Также КК смог решить задачу по
моделированию состояний суперпозиции за 200 секунд, при том, что обычный
компьютер потребует на это около 10 тысяч лет [24].
Поэтому будущее за решением задач по
машинному обучению с использованием квантового преимущества: если персональному
компьютеру нужно 500 лет, чтобы обучить отличать кошку от собаки (без
параллельных вычислений), то КК затратит на это секунды (рис. 32).
Рис. 32. Сравнение квантового и классического
компьютеров [25]
Но для эффективного управления этой
системой требуется вовлечение не только специалистов в области
IT,
но также физиков, поскольку её работа базируется на физических свойствах электронов.
То есть элементом вычисления в КК является либо электрон (минус или ноль
символизирует отрицательный спин электрона, а плюс или единица – положительный
спин электрона), либо поляризованный свет, если это на фотонах. Но на сегодня
общепризнанной и наиболее перспективной элементной базой для построения КК
являются сверхпроводящие кубиты на базе контактов Джозефсона.
Кубиты, основанные на эффекте Джозефсона (джозефсоновские
кубиты), состоят из сверхпроводящих структур с джозефсоновскими контактами –
туннельными контактами между двумя сверхпроводниками, разделёнными слоем
диэлектрика толщиной
сантиметров.
Эта
система взаимодействует с реальным миром, её необходимо сначала изолировать от
этого внешнего мира для того, чтобы внешние факторы не влияли на вычисления,
которые должны быть «чистыми». На сегодняшний день очистка данных – одна из
сложнейших задач, которые решаются для КК.
Также эти машины работают только при очень
низких температурах. То есть существует ряд ограничений физического характера, которые
необходимо решить – над этим бьются
IT-эксперты
(продвинутые программисты, которые пишут алгоритмы для КК) и физики высшего
уровня крупнейших компаний (Google,
IBM
и др.), имеющих соответствующий бюджет, поскольку это многомиллиардные проекты
для их реализации [23, 25].
В 2016 году компания IBM создала КК на 5
кубитов (рис. 33), в последующие годы – на 49 и 50 кубитов. Начиная с 2020 года
компания
Microsoft
открыла
Azure-сервис,
который позволяет дистанционно в «облаке» осуществлять эти вычисления. А в
конце 2022 года Китай выпустил домашний КК стоимостью около 590 тысяч рублей,
что дешевле автомобиля
Lada
Granta.
Модель позиционируется как базовое
решение для знакомства со многими нюансами квантовых вычислений в учебных
заведениях [26].
Рис. 33. Развитие КВ
Для сравнения: запоминающая
электронно-лучевая трубка (трубка Уильямса-Килберна), разработанная в далеком
1946 году, имела объем памяти 1024 бита для вывода двумерных массивов из азбуки
Морзе (рис. 34). Использовалась трубка в качестве носителя памяти на ранних
компьютерах.
Рис. 34. Запоминающая трубка Уильямса-Килберна
Приведём пример КВ в криптографии – науке
о защите данных. Есть широко распространённый протокол
RSA
с открытым ключом
который используется в цифровой подписи. Обычному компьютеру нужны десятилетия
для того, чтобы взломать этот шифр методом
Bruteforce
(«грубый перебор») или с помощью каких-то ускоряющих подбор алгоритмов. Однако
предложенный в 1994 году алгоритм Шора (Shor
P. W.) полиномиальной сложности позволяет свести задачу криптостойкости к
технологической задаче создания КК за счет использования квантового
параллелизма.
Поэтому КК вскрывает такой ключ меньше чем
за секунду. Соответственно, как только КК придут в наш мир, то всё шифрование,
которое существовало до сих пор, можно «перечеркнуть» и делать заново. Т.е. криптографию
придется кардинально усложнить для того, чтобы простым перебором невозможно
было взломать пароль и получить доступ к нашему банковскому счету [23, 27]
(рис. 35). Соответственно, это даст ещё больше работы для сотрудников
IT-сферы.
Рис. 35. Примеры решаемых задач для КК
Когда такие вычислительные возможности,
как ИИ и машинное обучение, начнут принимать решения в несколько раз быстрее,
чем на текущем уровне развития, это будет свидетельствовать о значительном
прогрессе в сфере
IT.
Например,
прогнозирование погоды до сих пор является сложной задачей. Это многофакторная
модель, а КК смогут прогнозировать вероятность всех сценариев с высокой
точностью. Близкая к совершенной безопасность шифрования
изучение неизвестных
ранее заболеваний, моделирование и синтез различных лекарств, развитие процессов
заболевания приведут, возможно, к пятой промышленной революции [28, 29].
Как мы говорили, в классическом бите есть
ноль и единица (транзистор: вкл. и выкл.), он всегда находится в одном
состоянии из двух. В квантовом компьютере кубит (q-бит от
quantum
bit)
всегда находится в одном состоянии
– т.н. суперпозиции, и сам кубит может быть как нулём, так и единицей (рис. 36).
Здесь также используется привычная для ЭВМ двоичная система счисления, но про
состояние кубита нельзя однозначно сказать, что он содержит – 0 или 1. На
выходе заданного алгоритма мы имеем выборку из вероятностного распределения
конечных реализаций алгоритма плюс возможные ошибки. Т.е. работа КК основана на
вероятностном принципе.
Рис. 36. Образное представление квантового бита
Принцип суперпозиции – это фундаментальный
принцип квантовой механики, допускающий существование любой линейной комбинации
для допустимых состояний
и
некоторой
квантовой системы. Эта комбинация называется суперпозицией состояний
и
(принцип
суперпозиции состояний). Попробуем объяснить это на более простом примере.
Определение эмоционального состояния
человека на основе его внешнего вида является сложной задачей, т.к. человек, показывая
определенное выражения лица или жесты, может одновременно испытывать как
положительные, так и отрицательные эмоции. Тем более выражение лица и жесты
могут быть умышленно контролируемыми и не всегда отражают реальные
эмоциональные переживания. Пока мы не зададим вопрос о том, как он себя
чувствует, мы не узнаем, хорошо ему или плохо – это можно назвать состоянием
суперпозиции. Кубит также одновременно имеет ноль и единицу до тех пор, пока
суперпозиция не будет разрушена [30, 31].
Если мы возьмем классический регистр из
трех битов (например, 101 – это классический регистр, который даёт нам
определенное значение), то квантовый регистр, из трех кубитов содержит в себе одновременно
значений, то есть все возможные сочетания
нулей и единиц, которые можно записать в 3 разряда (рис. 37).
Рис. 37. Цифровая запись квантового регистра – кубита
Уже на таком примере мы видим
преимущество: в трех классических битах – одно число, а в трех кубитах – в
восемь раз больше. В 4 кубитах будет
чисел,
в пяти кубитах
и т.д. С увеличением
количества кубитов наблюдается экспоненциальный рост вычислительной мощности
(),
а в обычной системе –квадратичный рост
().
На 100 бит информации можно
записать несколько чисел (например, число от 0 до 1023 займет 10 бит), короткие
текстовые сообщения (слово «Привет» займет 40-50 бит), коды символов (набор из
12 символов ASCII займет 12 бит на символ), инструкции для компьютера или
различные типы данных, такие как бинарные данные или простые команды. В 100
кубитах могут поместиться числа, текстовые сообщения, программы, звуковые
файлы, изображения и видеофайлы с низким разрешением – это зависит от типа
данных и их сжатия.
3.5-дюймовые дискеты вмещали 1.44
мегабайта информации, наши первые
flash-карты
позволяли записать 32 и 64 мегабайта, сейчас этот объем вырос до гига- и терабайтов.
В кубитах это огромное количество значений, которое он содержит одновременно. Как
и в нашем примере с человеком, он содержит в себе сразу миллионы разных
состояний: какое у него настроение, какое состояние, сколько у него денег с
собой, телефон с собой есть или нет, есть или нет у него жена, дети, родители,
имеет или нет квартиру, дачу, машину, кошелек, ключи – вся эта информация
содержится в нашем человеке одновременно и мы можем каким-то образом
взаимодействовать с ним и узнать, что у него есть, чего нет и как это между
собой взаимосвязано [32]. Обычные носки могут демонстрировать принцип квантовой
связи. Когда один носок надевается на левую ногу, он автоматически становится
левым, при этом другой носок становится правым, независимо от его расположения:
в другой комнате или на другой планете. До момента надевания носков их
состояние не определено, носки находятся в состоянии суперпозиции.
Лучшим результатом работы КК является наиболее
вероятный ответ из возможных. И здесь же стоит подчеркнуть минус КВ: пока не
существует квантовой памяти [33]. Квантовая память – это специфический вид
информационной памяти в квантовых системах, который использует квантовые
свойства частиц для хранения и обработки квантовой информации. Поэтому
ближайшее десятилетие КК будут неразрывно связаны с классическими компьютерами.
Итак, база, на которой строятся КВ и КК:
1. Состояние суперпозиции,
определённое ранее – когда система одновременно находится во всех состояниях,
которые возможны. В квантовой механике наиболее близкую аналогию кубита можно
провести с котом Шрёдингера. Есть такой мысленный эксперимент, как «Кот Шрёдингера», который говорит о том, что кот в
эксперименте одновременно есть и нет (рис. 38).
Рис. 38. Мысленный эксперимент «Кот Шрёдингера»
Предположим, есть черная коробка и там
находится кот. Но пока мы не откроем коробку, мы не узнаем, жив он там или нет,
кот находится в состоянии суперпозиции: он одновременно жив и мертв. Если
открываем коробку и там кот жив, то мы определились – суперпозиция разрушена.
Но до этого зверь, вероятно, жив и, вероятно, нет.
2. Квантовая запутанность (рис. 39) –
взаимодействие квантовых состояний двух или более объектов. Они сохраняют связь
навсегда и на какое расстояние мы бы ни развели два электрона,
взаимодействовавших между собой (даже в разных галактиках), при изменении спина
одного электрона, другой спин тоже изменится, и они останутся навсегда
взаимосвязаны. Это позволяет делать связанные состояния: например, если человек
сегодня забыл ключи, то у него плохое настроение. Прописать все эти условия
через условные операторы, функции и прочие методы не сможет ни один программист
[18]. Квантовая запутанность позволяет отобразить все состояния одновременно, и
они все между собой взаимосвязаны, благодаря чему КК природным образом
позволяют осуществлять параллельные вычисления.
Рис. 39. Квантовая запутанность [34]
Сейчас КВ используют только достаточно
крупные многомиллиардные компании. Например,
Volkswagen
Group
– один из крупнейших в мире
производителей автомобилей. Рядом идут цифровые корпорации, которые используют
это для своих производственных целей и сложных вычислений:
Google,
IBM,
Apple
– компании, которые находятся в технологическом авангарде на сегодня (рис. 40).
Рис. 40. Использование КВ и КК
Однако в настоящее время КК не получили
широкого распространения, подобно персональным компьютерам из-за высокой
стоимости и отсутствия стандартной модели (за исключением частичной реализации
этого в Китае, как можно видеть на рис. 33).
Для повышения точности вычислений нужны
очень низкая температура и создание условий, в которых КК будет изолирован от
внешнего мира, потому что изменения внешней среды будут влиять на связанность
элементов. С увеличением количества кубитов система становится менее стабильной
– все кубиты в любом случае взаимодействуют между собой и могут потерять
состояние суперпозиции (рис. 41).
Рис. 41. Проблемы КВ и китайский КК
Как упоминалось ранее, мы находимся на
очень раннем этапе разработки квантовой памяти и всех КВ в целом. В ноябре 2022
года только была создана масштабируемая квантовая память, которая живет больше
2 секунд [35]. В России квантовые технологии пока развиты слабо.
Как и любая новая технология (или
стартап), внедрение КВ и КК должны удовлетворять трём условиям: во-первых,
иметь законное разрешение (в ряде случаев может использоваться принцип «регуляторной
песочницы»); во-вторых, иметь конкурентные преимущества; в-третьих, обязательно
такие технологии должны быть безопасными.
Первая часть исследования завершится
анализом полуфантастической концепции, представленной авторами, которая, будучи
тесно связанной с реальностью, остается нереализуемой до настоящего времени. Исследования
в сферах ИИ,
DaS,
КВ и цифровых экосистем
неразрывно связаны между собой. Впервые в этой работе предлагается оригинальный
шаг к «оживлению» ЭВМ путем включения сил природы в компоненты цифрового мира (рис.
42).
Рис. 42. Компоненты DNAC цифрового мира
Если взять обладателя естественного
интеллекта – человека, то можно заметить, что у него есть не только мозг с интеллектом,
но и физический организм (по сути, «аккумулятор» для мозга): в безвоздушном
пространстве не живет ни один
homo
sapiens.
Может быть, именно
природные условия, физическая и социальная среда влияют на принятие нами
осознанных решений? Можно ли создать «дышащий кибернетический организм»,
который будет функционировать и принимать решения автономно за счет природных
сил (например, атмосферного электричества) и анализа
Big
Data
без стационарной подзарядки
аккумулятора? Физика отвечает утвердительно.
В книге [36] можно найти вариант псевдовечного
(дарового) двигателя, который использует силы природы для выработки энергии
и работает
до износа своих составных частей без нарушения законов термодинамики (рис. 43).
Исследование получения энергии из воздуха (т.н. атмосферного электричества) путем
химических преобразований позволило бы «замкнуть» нейросетевые технологии и их
развитие на силах природы (без вмешательства человека; самообучающийся ИИ – уже
не новость).
Рис. 43. «Вечные» часы, которые заводятся при помощи
сил природы
Анализ больших данных о гравитации окружающих объектов и сбор прочих актуальных параметров (физические явления в
атмосфере, социальная обстановка, собственные характеристики и др.) – ещё один
(или основной) компонент будущего машинного разума. Таким образом, предположения
британского футуролога и популяризатора науки Дугала Диксона (англ.
Dougal
Dixon)
о человеке будущего можно прервать печальным
выводом о том, что развитие ИИ приведет к массовому вымиранию человечества.
Однако проведём расчеты для нашего мысленного
эксперимента. Завод обыкновенных часов на сутки требует энергии
(килограммометр,
килограмм-сила-метр) или
.
Современный
компьютер потребляет гораздо больше энергии:
или
за 24 часа непрерывной работы.
Оценим стоимость механизма для завода часов в 1 коп. Тогда механизм для
«завода» компьютера на сутки будет стоить
руб.
(не говоря о суперкомпьютерах, потребляющих Мегаватты). Пусть стоимость
электричества в Москве составляет 5.92 руб. за
,
т.е. около 142.1 руб. на компьютер за 24 часа, что в
раз дешевле чем
псевдовечный механизм. Это экономически нецелесообразно.
Казалось бы, 123 077 руб. – сумма
небольшая для источника питания компьютера. Но вспомним, что мы сравнивали это
с 1 копейкой. Предположим теперь, что на самом деле механизм для завода
псевдовечных часов стоит минимум 10 000 руб., т.е. 1 000 000 коп. Отсюда 123.1
млрд руб. для одного «вечного» домашнего компьютера (где прогресс не стоит на
месте) говорит о том, что игра не стоит свеч.
Таким образом, гипотеза об объединении
дарового двигателя и нейросетевых технологий признается несостоятельной на
сегодняшний день ввиду экономического аспекта, хотя теоретически это возможно.
Тем не менее история компьютеров насчитывает менее 100 лет: создание ЭВМ
началось в пятидесятых годах XX века [14]; впереди – квантовые вычисления, а КК
позволят решить узкую специализацию нейросетей, во много раз превышая скорость
вычислений традиционных компьютеров. При этом эволюция машинного разума не
обязательно ограничивается тестом Алана Тьюринга и может занять не меньше
времени, чем эволюция человека. К середине
XXI
века начнётся внедрение элементов
Web
4.0 – Нейронета, чему уделено внимание во второй части исследования, где будут
освещены возможности и проблемы кибернетики умных устройств, сети Blockchain,
концепции интернета Web 3.0 и метавселенных в объеме, подобном объему этой
рукописи. Вполне вероятно, что самые мощные на сегодня суперкомпьютеры
соответствуют уровню инфузорий в биологической эволюции.
Иллюстративный материал для публикации
предоставлен образовательной платформой GeekBrains. Поэтому во избежание
нарушения авторских прав на изображениях статьи содержится логотип компании. Перевод
этой статьи на английский язык организован Центром перевода и внутреннего
рецензирования Финансового университета при Правительстве Российской Федерации.
1.
Дефицит
ИТ-мозгов: как Россия решает проблему кадрового голода в отрасли.
URL :https://www.rbc.ru/economics/28/07/2022/62e12c929a794747597da279
(дата
обращения 08.10.2022).
2.
Авербух
В.Л. Развитие человеко-компьютерного взаимодействия // Научная визуализация.
2020. Т. 12. № 5. С. 130-164.
DOI:
10.26583/sv.12.5.11.
3.
Пластов
М.А. Портрет Маподумы. М.: Детская литература, 1987. – 44 с.
4.
Ручкин
В.Н. Универсальный искусственный интеллект и экспертные системы. СПб:
БХВ-Петербург, 2009. – 240 с.
5.
Макафи
Э., Бриньолфсон Э. Машина, платформа, толпа: наше цифровое будущее [перевод с
английского Е. Поникаров]. М.:
Манн,
Иванов
и
Фербер,
2019. – 365
с.
6.
King B. Bank 4.0: Banking everywhere,
never at a Bank. Singapore: John Wiley & Sons Ltd; 2018. 352 p.
7.
Математика.
Информатика:
Энциклопедия.
–
М.:
Росмэн
-
Пресс,
2007. – 544
с.
8.
Shevchenko Yu.L., Ablicov A.Yu., Vetshev
P.S., Ablicov Yu.A., Vasilashko V.I., Orlov S.S., Lukyanov P.A., Kryachko V.S.
Modern technologies in surgery of the mediastinum. Bulletin of Pirogov National
Medical & Surgical Center. Vol. 15, no. 1. Pp. 4-12.
DOI:
10.25881/BPNMSC.2020.82.77.001.
9.
Волчек
А.И., Сагун А.Е. Путь в IT: Узнайте все про мир информационных технологий и
смените сферу деятельности. М.: ООО GeekBrains (URL: https://gb.ru/),
2022. – 89 с.
10.
Десять
крутых фишек нейросети ChatGPT для разработчиков и ИБ-специалистов. URL:
https://www.securitylab.ru/news/535151.php
(дата
обращения 30.03.2023).
11.
Нейросеть
for
Fun.
URL: https://t.me/neirofun
(дата
обращения 17.01.2023).
12.
Как
не поддаться на обман ChatGPT и как обмануть его самому. URL:
https://3dnews.ru/1084679/kak-obmanut-chatgpt-i-ne-poddatsya-na-ego-obman
(дата
обращения 12.04.2023).
13.
Nasibullin R.G., Shafigullin I.K.
Avkhadiev-becker type p-valent conditions for harmonic mappings of the unit
disk and its exterior // Mathematical Reports. 2020.
Т.
22. № 1. Pp. 59-71.
14.
Мечтает
ли нейросеть
LaMDA
об отмене законов
робототехники?
URL: https://habr.com/ru/companies/ruvds/articles/679636/
(дата обращения 21.11.2023).
15.
Айзек
Азимов. Путеводитель по науке. От египетских пирамид до космических станций. –
М.: ЗАО Центрполиграф, 2006. – 788 с.
16.
Виктор
де Касто. ПРО КРИПТОГРАФИЮ (Символ – машина – квант). СПб.: Страта, 2020. – 240
с.
17.
Правда
или миф, что смартфоны нас подслушивают?
URL: https://www.kaspersky.ru/blog/smartphones-eavesdropping/23201/
(дата
обращения 21.01.2023).
18.
Хайнеман
Д. Алгоритмы. С примерами на
Python.
СПб.: Питер, 2023. – 304 с.
19.
Минимизация
киберрисков в условиях функционирования ТЭБ, экосистем и виртуальных активов:
Учебное пособие / П.В. Ревенков, С.С. Осмоловец, А.А. Бердюгин, И.В. Ожеред. М.:
Прометей,
2022. – 368
с.
20.
Tsaregorodtsev A.V., Samoilov V.E., Budnik
E.A. Informative and Communicative Environment for the Development of Student
Creativity and Flexible Skills // Technology, Innovation and Creativity in
Digital Society, St. Petersburg, October 2021. St. Petersburg: Springer Nature
Switzerland, 2022. – Pp. 232-241. DOI 10.1007/978-3-030-89708-6_20. – EDN
YUFFTV.
21.
Крылов
Г.О., Зенкина И.В., Ломоносова Е.В. и др. Статистика, аналитика и
прогнозирование в современной экономике: опыт и перспективы развития:
коллективная монография. М.: ООО «Издательство “КноРус”», 2022. – 204 c.
22.
Фролова
М.С. Физика и методы преподавания ее в школе // Международный журнал
гуманитарных и естественных наук. 2022. № 5-1 (68). С. 276-280.
DOI: 10.24412/2500-1000-2022-5-1-276-280.
23.
Бердюгин
А.А., Ревенков П.В. Квантовые вычисления и квантовые компьютеры: развитие,
проблемы и перспективы // Сборник трудов
XII
международной научно-технической конференции «Безопасные информационные
технологии». М.: МГТУ им. Н.Э. Баумана, 2023. С. 22-28.
24.
Google:
квантовый компьютер впервые превзошёл обычный.
URL: https://www.vesti.ru/nauka/article/1238158
(дата
обращения 23.01.2023).
25.
Arute F., Arya K., Babbush R., Bacon D.,
Bardin J.C., Barends R. et al. Quantum supremacy using a programmable
superconducting processor. Nature 2019. Vol. 574, pp. 505–510. DOI:
10.1038/s41586-019-1666-5. URL: https://www.nature.com/articles/s41586-019-1666-5.pdf
(accessed 30.11.2023).
26.
Евсиков
К.С. Информационная безопасность цифрового государства в квантовую эпоху //
Вестник Университета имени О.Е. Кутафина (МГЮА). 2022. № 4 (92).
С.
46-58. DOI: 10.17803/2311-5998.2022.92.4.046-058.
27.
Tsaregorodtsev A. V., Lvovich I.Ya., Shikhaliev
M.S., Zelenina A.N., Choporov O.N. Information security management for cloud
infrastructure // International Journal on Information Technologies and
Security. 2019. Vol. 11 (3). Pp.
91-100.
28.
Физика:
Справочник школьника и студента / Под ред. проф. Р. Гёбеля; Пер. с нем. – М.:
Дрофа, 2003. – 368 с.
29.
Кун
Т. Структура научных революций [пер. с англ. И. Налетова]. Москва: Изд-во АСТ,
2020. – 320 с.
30.
Дворянкин
С.В., Дворянкин Н.С., Устинов Р.А. Речеподобная помеха, стойкая к шумоочистке,
как результат скремблирования защищаемой речи // Вопросы кибербезопасности.
2022. № 5 (51). С. 14-27. DOI: 10.21681/2311-3456-2022-5-14-27.
31.
Бердюгин
А.А. Обеспечение безопасности естественного интеллекта в условиях развития
киберпространства // Защита информации. Инсайд.
2022. № 5.
С.
75–81.
32.
Tsaregorodtsev, A. Automation of the
distribution process of sensitive data processing in a hybrid cloud computing
environment / A. Tsaregorodtsev, A. Zelenina // Information Technology
Applications. – 2016. – No. 1. – Pp. 137-148. – EDN WIQHUL.
33.
Букашкин
С.
А.,
Черепнев
М.
А.
Квантовые
устройства
в
криптографии
// International Journal of Open Information Technologies. 2023.
Т.
11. № 1.
С.
104-108.
34.
Moreau P.-A., Toninelli E., Thomas G. et
al. Imaging Bell-type nonlocal behavior. Science Advances. Vol 5, Iss. 7. July
2019, DOI: 10.1126/sciadv.aaw2563.
35.
Shi-Jia Wang, Yu-Hui Chen, Jevon J.
Longdell, Xiangdong Zhang. Hyperfine states of erbium doped yttrium
orthosilicate for long-coherence-time quantum memories. Journal of
Luminescence. Vol. 262. October 2023, 119935. DOI:
10.1016/j.jlumin.2023.119935.
36.
Перельман
Я.И. Занимательная физика. – М.: АСТ, 2018. – 352 с. – (Эксклюзив: Русская классика).
Для
сравнения: возраст нашей Вселенной оценивают всего в 15 миллиардов лет.
Фрактал
(лат. fractus – дроблёный, сломанный, разбитый) – множество, обладающее
свойством самоподобия.
Это
подтверждает CAPTCHA – от англ.
Completely
Automated
Public
Turing
test
to
tell
Computers
and
Humans
Apart
– полностью
автоматизированный публичный тест Тьюринга для различения компьютеров и людей.
Суть
проблемы заключается в том, что человек сталкивается с нравственным выбором: жертвовать
ли одним человеком во избежание нескольких жертв. Модификации задачи и исследования
в этой области помогают понять моральные дилеммы, а также их связь с личностными
особенностями.
Meta
Platforms
Inc., в том числе
ее продукты Facebook и
Instagram,
признаны экстремистскими
организациями в Российской Федерации. Их деятельность запрещена на территории
страны.
Визуализация
данных позволяет не только упростить исследование, но и представить сложные
данные в наглядной форме для их презентации, помогая аналитикам объяснить свои
выводы заказчикам и другим заинтересованным лицам.
Напомним,
уровни навыков разработчика (программиста) условно можно поделить на Junior,
Middle и
Senior,
и эта градация не обязательно зависит от их возрастных
различий.
Криптосистемы
с симметричным ключом требуют разделения задачи обеспечения секретности между
двумя абонентами, а системы с открытым ключом (например, RSA) позволяют каждому
абоненту персонально создать и сохранить собственную задачу по обеспечению
секретности.
Первое
правило кибербезопасности гласит: абсолютной защиты не существует. Возможно, и
это утверждение не абсолютно до развития квантовых компьютеров.
Например,
эксплуатация движений барометра для завода часового механизма.
Back to the Future: Visualization of Development, Problems and Prospects of Artificial Intelligence, Data Science, Quantum Computing
Authors: A.V. Tsaregorodtsev1, P.V. Revenkov2, A.A. Berdyugin3
Financial University under the Government of the Russian Federation, Moscow, Russia
1 ORCID: 0000-0002-8447-3352, anvtsaregorodtsev@fa.ru
2 ORCID: 0000-0002-0354-0665, pvrevenkov@fa.ru
3 ORCID: 0000-0003-2301-1776, aaberdyugin@fa.ru
Abstract
The paper is designed as a review and analysis of the current situation in the field of information technology (IT). The relevance of the article arises from the need to popularize IT among young people, which is reflected in the documents of the Ministry of Digital Development, Communications and Mass Communications of the Russian Federation, as well as from the high demand for experts in the field of digital technologies and the need to increase the digitalization of Russia. According to GeekBrains (the first programming school in Russia, which appeared in 2010, and the leader in the field of training for digital professions, which operates in 85 regions of the Russian Federation and 21 countries of the world), the number of IT job vacancies in this country will grow up to 2 million by 2027. All large organizations are looking for specialists in different IT branches, which are described in this and the following research paper. In this article, which is the first part of the study, the capabilities and problems of the following advanced technologies are considered: artificial intelligence, Data Science and quantum computing. The concepts of technologies are analyzed from the viewpoints of their everyday use and professional application. The topics are closely related and complement each other in one way or another. The article follows the logic and chronology of events in the global IT sphere. The conclusion contains a description of the author's thought experiment about bringing machine intelligence to life, it accumulates the mentioned technologies while taking into account the laws of physics. The calculations for this experiment are given as well. The materials from one of the GeekBrains's educational shows “The Way to IT” were used, including the GIF animation, which is reproduced only on the website of the “Scientific Visualization” journal.
Keywords: information, neural network, artificial intelligence, machine learning, data science, quantum computing, quantum computers.
1.
Shortage of IT brains: how Russia solves
the problem of personnel shortage in the industry. URL: https://www.rbc.ru/economics/28/07/2022/62e12c929a794747597da279
(accessed 08.10.2022).
2.
Averbukh V.L. Evolution of Human Computer
Interaction // Scientific Visualization. 2020. Vol. 12, no. 5. Pp. 130–164,
DOI: 10.26583/sv.12.5.11. [in Russian].
3.
Plastov M.A. Portrait of Mapoduma. M.:
Children's Literature, 1987. – 44 p.
4.
Ruchkin V.N. Universal artificial
intelligence and expert systems. St. Petersburg: BHV-Petersburg, 2009. – 240 p.
5.
McAfee E., Brynjolfson E. Machine,
platform, crowd: our digital future [translated from English by E. Ponikarov].
M.: Mann, Ivanov and Ferber, 2019. – 365 p.
6.
King B. Bank 4.0: Banking everywhere,
never at a Bank. Singapore: John Wiley & Sons Ltd; 2018. 352 p.
7.
Mathematics. Computer science:
Encyclopedia. – M.: Rosman-Press, 2007. – 544 p.
8.
Shevchenko Yu.L., Ablicov A.Yu., Vetshev
P.S., Ablicov Yu.A., Vasilashko V.I., Orlov S.S., Lukyanov P.A., Kryachko V.S.
Modern technologies in surgery of the mediastinum. Bulletin of Pirogov National
Medical & Surgical Center. Vol. 15, no. 1. Pp. 4-12. DOI:
10.25881/BPNMSC.2020.82.77.001.
9.
Volchek A.I., Sagun A.E. Path to IT: Learn
everything about the world of information technology and change the field of
activity. Moscow: OOO GeekBrains (GeekBrains, LLC; https://gb.ru/), 2022. – 89
p.
10.
Ten cool ChatGPT neural network chips for
developers and information security specialists. URL: https://www.securitylab.ru/news/535151.php
(accessed 30.03.2023).
11.
Neural network for Fun. URL: https://t.me/neirofun
(accessed 17.01.2023).
12.
How not to be deceived by ChatGPT and how
to deceive him yourself. URL: https://3dnews.ru/1084679/kak-obmanut-chatgpt-i-ne-poddatsya-na-ego-obman
]
(accessed 12.04.2023).
13.
Nasibullin R.G., Shafigullin I.K.
Avkhadiev-becker type p-valent conditions for harmonic mappings of the unit
disk and its exterior // Mathematical Reports. 2020.
Т.
22. № 1. Pp. 59-71.
14.
Does the LaMDA neural network dream of
repealing robotics laws? URL: https://habr.com/ru/companies/ruvds/articles/679636/
(accessed 21.11.2023).
15.
Isaac Asimov. A guide to science. From the
Egyptian pyramids to space stations. – Moscow: ZAO Tsentrpoligraf
(Tsentrpoligraf, CJSC), 2006. – 788 p.
16.
Victor de Casto. ABOUT CRYPTOGRAPHY
(Symbol – machine – quantum). St. Petersburg: Strata, 2020. – 240 p.
17.
Is it true or a myth that smartphones are
eavesdropping on us? URL: https://www.kaspersky.ru/blog/smartphones-eavesdropping/23201/
(accessed 21.01.2023).
18.
Heineman G. Learning Algorithms: A
Programmer's Guide to Writing Better Code. California, Sebastopol: O'Reilly
Media, 2021. – 278 p.
19.
Minimization of cyber risks in the
conditions of functioning of EBT, ecosystems and virtual assets: Textbook /
P.V. Revenkov, S.S. Osmolovets, A.A. Berdyugin, I.V. Ozhered. M.: Prometheus,
2022. – 368 p.
20.
Tsaregorodtsev A.V., Samoilov V.E., Budnik
E.A. Informative and Communicative Environment for the Development of Student
Creativity and Flexible Skills // Technology, Innovation and Creativity in
Digital Society, St. Petersburg, October 2021. St. Petersburg: Springer Nature
Switzerland, 2022. – Pp. 232-241. DOI 10.1007/978-3-030-89708-6_20. – EDN
YUFFTV.
21.
Krylov G.O., Zenkina I.V., Lomonosova
E.V., etc. Statistics, analytics and forecasting in the modern economy:
experience and prospects for development: a collective monograph. M.: LLC
“KnoRus Publishing House”, 2022. – 204 p.
22.
Frolova M.S. Physics and methods of
teaching it at school. International Journal of Humanities and Natural
Sciences. 2022. No. 5-1 (68). Pp. 276-280. DOI:
10.24412/2500-1000-2022-5-1-276-280.
23.
Berdyugin A.A., Revenkov P.V. Quantum
computing and quantum computers: development, problems and prospects //
Collection of proceedings of the XII International Scientific and Technical
Conference “Safe Information Technologies”. M.: MSTU named after N.E. Bauman,
2023. Pp. 22-28.
24.
Google: a quantum computer surpasses a
conventional one for the first time. URL: https://www.vesti.ru/nauka/article/1238158
(accessed 23.01.2023).
25.
Arute F., Arya K., Babbush R., Bacon D.,
Bardin J.C., Barends R. et al. Quantum supremacy using a programmable
superconducting processor. Nature 2019. Vol. 574, pp. 505–510. DOI: 10.1038/s41586-019-1666-5.
URL: https://www.nature.com/articles/s41586-019-1666-5.pdf
(accessed 30.11.2023).
26.
Evsikov K.S. Information security of the
digital state in the quantum era. Bulletin of the O.E. Kutafin University
(MGUA). 2022. No. 4 (92). Pp. 46-58. DOI: 10.17803/2311-5998.2022.92.4.046-058.
27.
Tsaregorodtsev
A. V., Lvovich I.Ya., Shikhaliev M.S., Zelenina A.N., Choporov O.N. Information
security management for cloud infrastructure // International Journal on
Information Technologies and Security.
2019.
Vol. 11 (3). Pp. 91-100.
28.
Wissensspeicher Physik / Herausgegeben von
Prof. Dr. habil. Rudolf Göbel.
Berlin: Volk und
Wissen Verlag GmbH, 1998 – 368 p.
29.
Kuhn T. The Structure of scientific
revolutions. Moscow; AST Publ., 2020. – 320 p.
30.
Dvoryankin S.V., Dvoryankin N.S., Ustinov
R.A. Speech-like interference resistant to noise cleaning as a result of
scrambling protected speech // Questions of cybersecurity. 2022. No. 5 (51). Pp.
14-27. DOI: 10.21681/2311-3456-2022-5-14-27.
31.
Berdyugin A.A. Ensuring the Security of
Natural Intelligence in the Conditions of Cyberspace Development // Information
Protection. Inside. 2022. No. 5. Pp. 75–81.
32.
Tsaregorodtsev, A. Automation of the
distribution process of sensitive data processing in a hybrid cloud computing
environment / A. Tsaregorodtsev, A. Zelenina // Information Technology
Applications. – 2016. – No 1. – Pp. 137-148. – EDN WIQHUL.
33.
Bukashkin S.A., Cherepnev M.A. Quantum
devices in cryptography. International Journal of Open Information
Technologies. 2023. Vol. 11. No. 1. Pp. 104-108.
34.
Moreau P.-A., Toninelli E., Thomas G. et
al.
Imaging Bell-type nonlocal behavior.
Science Advances. Vol 5, Iss. 7. July 2019, DOI: 10.1126/sciadv.aaw2563.
35.
Shi-Jia Wang, Yu-Hui Chen, Jevon J.
Longdell, Xiangdong Zhang. Hyperfine states of erbium doped yttrium
orthosilicate for long-coherence-time quantum memories. Journal of
Luminescence. Vol. 262. October 2023, 119935. DOI: 10.1016/j.jlumin.2023.119935.
36.
Perelman Ya.I. Entertaining physics. –
Moscow: AST, 2018. – 352 p. – (Exclusive: Russian classics).