0 просмотров

Объединение больших данных, искусственного интеллекта и бизнес-аналитики

Использование мощности графического процессора для повышения производительности и гибкости.

Амит Видж и Нима Негабан
9 октября 2017 г.

Выпуклая линза - сходимость

Выпуклая линза — сходимость (источник: Тесс Уотсон на Flickr)

Загрузите бесплатную электронную книгу O’Reilly «Введение в графические процессоры для анализа данных», чтобы узнать больше о том, как графические процессоры позволяют объединять большие данные, искусственный интеллект и бизнес-аналитику.

Когнитивные вычисления, которые стремятся имитировать человеческое мышление и рассуждения в режиме реального времени, можно считать конечной целью бизнес-аналитики. С когнитивными приложениями в здравоохранении, розничной торговле, финансовых услугах, производстве и транспорте искусственный интеллект уже трансформирует множество отраслей. Многие из сегодняшних приложений в области ИИ были бы непрактичными или даже невозможными, если бы не беспрецедентная цена и производительность, обеспечиваемые мощными параллельными вычислениями графического процессора.

В то время как постоянное развитие ЦП, памяти, хранилищ и сетей послужило основой для высокопроизводительного анализа данных, растущий объем данных означает, что даже ЦП, содержащие до 32 ядер, не могут обеспечить достаточную производительность для аналитики с интенсивными вычислениями. .А масштабирование производительности за счет создания больших кластеров серверов может сделать такую ​​сложную аналитику недоступной для многих организаций.

Статья в тему:  Как робот с искусственным интеллектом kiko.893 продолжает учиться

Учитесь быстрее. Копать глубже. Смотрите дальше.

Присоединяйтесь к платформе онлайн-обучения O'Reilly. Получите бесплатную пробную версию сегодня и находите ответы на лету или осваивайте что-то новое и полезное.

Итак, как оптимизировать вычисления, пропускную способность, мощность и стоимость, управляя различными наборами данных и используя новейшие инструменты машинного обучения, такие как TensorFlow, Caffe и Torch? В этой статье мы обсудим, как можно объединить рабочие нагрузки с большими данными, искусственным интеллектом и бизнес-аналитикой на единой платформе, использующей графические процессоры, для решения многих проблем, связанных с производительностью. Объединяя большие данные, искусственный интеллект и бизнес-аналитику на общей платформе с графическими процессорами, мы можем найти более доступные и масштабируемые решения.

Проблемы слияния AI и BI

Поучительно рассматривать взаимодействие между искусственным интеллектом и бизнес-аналитикой как конвейер, который пересекает домены, как показано на диаграмме ниже.

AI BI в разных доменах и системах

Этот конвейер начинается с специалистов по данным, которые извлекают данные из бизнес-приложений, обучают машинному обучению и другим моделям, а затем делают полученные модели доступными для бизнес-пользователей с помощью приложений бизнес-аналитики.

Когда используются отдельные системы, извлечение данных и предоставление моделей бизнес-пользователям по своей сути является дорогостоящим и медленным процессом. Проблемы, создаваемые такой конфигурацией, могут включать:

  • Высокая задержка – Данные тратят слишком много времени на переход и движение, что затрудняет, если не делает невозможным, итерационные и интерактивные процессы.
  • Чрезмерная сложность – Отдельные наборы данных, системы, инструменты и приложения имеют отдельные накладные расходы и требуют отдельного управления.
  • Критическая жесткость – Приспособление даже к незначительным изменениям в требованиях и наборах данных может быть трудным и дорогостоящим.
  • Плохая настойчивость – Перемещение данных по конвейеру без каких-либо средств постоянного сохранения создает риск потери и повреждения данных.
Статья в тему:  Что такое задача с 8 головоломками в искусственном интеллекте

Для скоропортящихся данных, когда результаты нужны быстро, чтобы можно было действовать, эти проблемы не могут быть экономически эффективно преодолены с использованием кластеров серверов, работающих только на процессорах. Даже для статических данных, где медленная реакция может быть приемлемой, в настоящее время существует более экономичное решение, чем кластер только на ЦП.

Конвергенция на единой платформе

Объединение больших данных, искусственного интеллекта и бизнес-аналитики на одной платформе устраняет проблемы, связанные с использованием отдельных систем, и при этом значительно повышает гибкость и производительность, а также создает множество возможностей для новых и усовершенствованных приложений. Лучше всего конвергенция достигается за счет того, что две области — специалисты по обработке данных и бизнес-пользователи — могут использовать единую платформу, а для этого требуется, чтобы платформа обеспечивала высокую производительность. На рисунке ниже показан пример базы данных, объединяющей два домена.

База данных ИИ

Графические процессоры обеспечивают высокую производительность в конвергентных базах данных

Из различных средств повышения производительности, включая специализированные интегральные схемы (ASIC) и программируемые вентильные матрицы (FPGA), ни одно не сравнится по цене и производительности с графическим процессором (GPU) в приложениях ИИ. Графические процессоры способны обрабатывать данные до 100 раз быстрее, чем конфигурации, содержащие только ЦП.

Причиной такого резкого улучшения являются их возможности массовой параллельной обработки, при этом некоторые графические процессоры содержат почти 6000 ядер, что более чем в 200 раз больше, чем от 16 до 32 ядер в самых мощных современных процессорах. Например, Tesla V100, основанный на новейшей архитектуре графического процессора NVIDIA Volta и оснащенный 5120 ядрами NVIDIA CUDA и 640 ядрами NVIDIA Tensor, обеспечивает производительность до 100 ЦП в одном графическом процессоре.Небольшие эффективные ядра графического процессора также лучше подходят для параллельного выполнения одинаковых повторяющихся инструкций, что делает его идеальным для ускорения ресурсоемких матричных и векторно-ориентированных рабочих нагрузок, характерных для машинного обучения.

Статья в тему:  Как искусственный интеллект изменил баскетбол

Для многих приложений ИИ один сервер с достаточной оперативной памятью и одной картой графического процессора обеспечит достаточную емкость и производительность. Конфигурацию можно масштабировать по мере необходимости, распределяя или сегментируя базу данных по кластеру серверов.

Конвергентная база данных ИИ позволяет специалистам по обработке и анализу данных работать непосредственно с исходными данными, что устраняет необходимость подготовки или извлечения данных и делает результаты доступными непосредственно для бизнес-пользователей. Устранение границ между областями науки о данных и бизнес-аналитики значительно упрощает запуск приложений ИИ.

Интеграция библиотек машинного обучения

Хотя различные решения для баз данных и анализа данных на основе графических процессоров предлагают разные возможности, все они предназначены для дополнения или интеграции с существующими приложениями и платформами. Большинство баз данных ИИ с ускорением на GPU имеют открытую архитектуру, которая позволяет интегрировать модели машинного обучения и библиотеки, такие как TensorFlow, Caffe и Torch. Они также поддерживают традиционные приложения реляционных баз данных, такие как SQL-92 и ODBC/JDBC. Специалисты по данным могут создавать настраиваемые пользовательские функции для разработки, тестирования и обучения моделирования и алгоритмов с использованием опубликованных API.

Объединение науки о данных с бизнес-аналитикой в ​​одной базе данных позволяет обеспечить критерии, необходимые для рабочих нагрузок ИИ, включая вычисления, пропускную способность, управление данными, совместимость, безопасность, эластичность и удобство использования. Некоторые из преимуществ включают в себя:

  • Обучение модели в 10-100 раз быстрее – Архитектура базы данных ИИ использует огромные возможности параллельной обработки графического процессора для обеспечения беспрецедентного уровня производительности.
  • Низкая задержка – Время отклика в миллисекундах обеспечивает поддержку потоковой передачи данных и интерактивных приложений.
  • Упорство – Общий набор данных, хранящийся на консолидированной платформе, может быть сохранен с помощью единого решения для резервного копирования и восстановления.
  • Ловкость – Унификация и упрощение инфраструктуры облегчает выполнение операций, что приводит к ускорению окупаемости инвестиций.
Статья в тему:  Что такое искусственный интеллект для 5 класса

Привнося вычисления в данные, мы преодолеваем проблемы, возникающие при перемещении данных по конвейеру, охватывающему разные домены и системы.

Чтобы узнать больше о том, как графические процессоры позволяют объединять большие данные, искусственный интеллект и бизнес-аналитику, загрузите бесплатный отчет O’Reilly «Введение в графические процессоры для анализа данных.”

голоса
Рейтинг статьи
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
Adblock
detector