Закрыть объявление

Искусственный интеллект, или ИИ, — это термин, который в наши дни часто употребляют. Будь то смартфон с Androidem, потоковый сервис, рекомендующий ваш следующий фильм, или музыкальная платформа, автоматически создающая плейлист — кажется, что ИИ просто повсюду. Но как развивалось определение ИИ и что на самом деле означают некоторые технические термины, связанные с ИИ?

Что такое ИИ?

Исторически под искусственным интеллектом подразумевался интеллект человеческого уровня, достигнутый искусственно с помощью машин. Однако с течением времени этот термин немного изменил свое первоначальное значение и теперь часто используется, среди прочего, как широкий маркетинговый термин. Сегодня почти все, что демонстрирует признаки интеллекта, от рекомендаций по электронной коммерции до систем распознавания голоса, называется ИИ. Однако с искусственным интеллектом связан ряд других терминов и сокращений. Давайте прольем свет на наиболее распространенные из них.

Машинное обучение (ML – машинное обучение)

Машинное обучение — это подкатегория искусственного интеллекта, в которой системы учатся на основе данных и опыта принимать решения или выполнять различные действия — например, если вы скормите алгоритму тысячи изображений кошек, он научится идентифицировать кошку. Затем вы можете предоставить фотографии кошек, собак и других животных. Затем система должна иметь возможность выбирать изображения кошек на основе того, что она «изучила». Этот процесс обучения включает в себя две основные фазы: обучение и вывод, что подводит нас к следующим терминам.

Подготовка

Фаза обучения — это длительный этап машинного обучения, на котором системе предоставляются огромные объемы данных для обучения — например, вышеупомянутые изображения кошек. Однако используемые данные могут представлять собой конкретные объекты, например цветы, или включать более крупные выборки, например весь Интернет. Обучение современных систем искусственного интеллекта, таких как ChatGPT, может стоить миллионы и требовать огромных вычислительных ресурсов.

Вывод

После обучения система применяет полученные знания к новым данным. На этом этапе происходит ввод данных конечным пользователем и прямая интеграция с ИИ. Например, теперь, когда система знает, что такое кошка, мы можем дать ей ее изображение, и она ее идентифицирует. Спросите чат-ботов Google Gemini или Microsoft Copilot, какая столица Англии, и они дадут вам ответ. На этом этапе система опирается на свои устоявшиеся знания. Этот этап требует значительно меньших вычислительных мощностей.

Общий искусственный интеллект (AGI)

AGI относится к машинам с интеллектом человеческого уровня, способным принимать решения, планировать и понимать мир в более широком контексте. В отличие от нынешних систем искусственного интеллекта, AGI будет иметь более глубокое понимание и осведомленность, подобно тому, что мы видим в научной фантастике. Хотя AGI по-прежнему остается музыкой далекого будущего, поскольку взлом этого кода потребует множества технических, философских и моральных вопросов, это значительная область исследований.

Генеративный ИИ

Традиционно ИИ преуспел в классификации и распознавании, но генеративный ИИ выходит за рамки этих идей и создает новый контент, такой как текст, изображения и музыка. Это революционное достижение открыло новые возможности в области искусственного интеллекта, позволяя системам генерировать творческие результаты на основе входных данных. Эта форма ИИ также приносит наиболее ощутимые преимущества обычным пользователям, особенно если вы когда-либо использовали ChatGPT для создания электронного письма или Midjourney для создания изображения кошки.

Нейронные сети

Нейронные сети являются основными строительными блоками и основой современного искусственного интеллекта. Они существуют уже несколько десятилетий и созданы по образцу человеческого мозга. Они состоят из взаимосвязанных нейронов, которые обрабатывают данные через разные уровни, что в конечном итоге дает результат. Обучение нейронной сети включает в себя настройку связей между нейронами для повышения точности.

Трансформационные сети

Особый тип нейронной сети — сеть преобразования — позволил разработать большие языковые модели (LLM), такие как ChatGPT. Эти сети превосходно понимают контекст и взаимосвязи в данных, что делает их идеальными для задач языковой обработки.

Большие языковые модели (LLM)

Когда объединяются нейронные сети, преобразователи и обучение очень большой нейронной сети, рождаются большие языковые модели. Так называемые LLM обучаются на огромных объемах текстовых данных, что позволяет им генерировать ответы, подобные человеческим. Примеры включают ChatGPT, Claude, LLaMA и Grok. Эти модели работают, предсказывая следующее слово в последовательности и выдавая последовательные и контекстуально релевантные результаты. Однако такой прогнозирующий характер может привести к таким проблемам, как галлюцинации, когда модель генерирует правдоподобную, но неверную информацию. И что это за галлюцинации?

Галлюцинация

Так называемые галлюцинации возникают, когда ИИ генерирует неверную информацию из-за того, что он полагается на прогнозное моделирование. Это серьезная проблема для LLM, поскольку они могут давать убедительные, но ложные результаты. Классическим примером галлюцинации может быть рекомендация использовать суперклей или термопистолет, когда его спрашивают, как не дать сыру соскользнуть с пиццы.

Параметры и размеры модели

Эффективность моделей ИИ часто измеряется их общими параметрами, которые представляют собой связи в нейронной сети. Более крупные модели с большим количеством параметров обычно работают лучше, но требуют больше ресурсов. Меньшие модели теоретически менее точны, но могут работать на более экономичном оборудовании. Например, огромная облачная модель LLaMA 3.1 имеет 405 миллиардов параметров, тогда как модели, которые изначально работают на смартфонах, состоят всего из нескольких миллиардов параметров.

Диффузионные модели

Модели диффузии — это модели, используемые для генерации изображений. Модели диффузии обращают вспять процесс добавления шума к изображениям во время обучения. Это позволяет им создавать новые изображения из случайного шума, руководствуясь изученными закономерностями.

Поисковая дополненная генерация (RAG)

RAG сочетает генеративный искусственный интеллект с внешними источниками данных для получения точных и контекстуально релевантных результатов. Загружая дополнительные данные, эти модели могут улучшить свои результаты, сделав их более надежными и полезными.

Сегодня самое читаемое

.