0 просмотров

Vision AI: что это такое и почему это важно?

компьютерное зрение ИИ

Зрительный ИИ (также известный как Computer Vision) — это область компьютерных наук, которая обучает компьютеры воспроизводить систему человеческого зрения. Это позволяет цифровым устройствам (таким как детекторы лиц, сканеры QR-кода) идентифицировать и обрабатывать объекты на изображениях и видео так же, как это делают люди.

Персонализированный поиск изображений в магазинах электронной коммерции, построение 3D-моделей (фотограмметрия), изображения с воздуха на карте, сканирование OCR в торговых точках, распознавание лиц, детекторы изображений, реконструкция МРТ — вот некоторые из инновационных вариантов использования компьютерного зрения, которые мы имеем сегодня.

Но когда появилась эта технология? Как это развивалось? Какие будущие возможности это открывает для бизнеса, независимо от отрасли? В следующем сегменте обсуждаются эти три фактора и кратко рассказывается о том, как работает искусственный интеллект. Итак, приступим.

История и эволюция компьютерного зрения:

Первый эксперимент по компьютерному зрению был проведен в 1950-х годах, когда нейронные сети использовались для обнаружения краев объекта и сортировки простых объектов, таких как квадраты и круги. Позже, в 1970-х годах, компьютерное зрение было реализовано в коммерческих целях. Это была интерпретация рукописного текста с использованием оптического распознавания символов (OCR). Это исполнение использовалось для интерпретации письменного текста для слепых. В 1999-х, по мере развития Интернета, программы распознавания лиц процветали. Позже, в 2010 году (и позже), глубокое обучение помогло компьютерам обучаться и самосовершенствоваться со временем.

Статья в тему:  Что такое задача с 8 головоломками в искусственном интеллекте

Сегодня эта технология нашла применение в различных областях, начиная от автомобилестроения, здравоохранения, розничной торговли, смартфонов и т. д. И то, что способствует прогрессу технологии Vision AI, — это доступная вычислительная мощность, лучшее оборудование, новые алгоритмы, такие как сверточные нейронные сети и т. д. В результате повышается точность выходных данных и улучшаются варианты использования технологии.

Ожидается, что благодаря своему потенциалу рынок ИИ компьютерного зрения к концу 2019 года будет стоить 1,6 миллиарда долларов США. | Источник: Статистика

ИИ компьютерного зрения: как это работает?

Считайте ИИ Computer Vision головоломкой. Есть несколько частей, которые вы должны собрать, чтобы создать изображение. Именно так работают нейронные сети для компьютерного зрения.Нейронные сети различают разные части изображения и определяют модель подкомпонентов.

Вместо того, чтобы давать подсказки для распознавания объекта, компьютер получает изображения, которые могут помочь в точной идентификации объекта. Предположим, вам нужно обучить компьютер распознавать кошку. Вместо того, чтобы давать подсказки, такие как различные хвосты, усы, заостренные уши, система загружается сотнями (или миллионами) изображений кошек. Созданная таким образом модель узнает о различных чертах, которые составляют кошку или отличают ее от других похожих животных.

Применение ИИ компьютерного зрения:

1. Сегментация изображения

Это процесс разделения изображения на несколько областей и частей на основе характеристик пикселей изображения. Сегментация изображения, обычно используемая в целях изучения, включает в себя отделение переднего плана от фона или группировку частей изображения по пикселям на основе сходства цвета или формы. Изображение, показанное ниже, иллюстрирует сегментацию изображения, когда части изображения различаются цветами.

Статья в тему:  Как искусственный интеллект может помочь военным медикам лечить иностранцев

Сегментация изображения

Изображение предоставлено: Research Gate

2. Обнаружение объекта

Обнаружение объекта

Эта область компьютерного зрения AI занимается обнаружением одного или нескольких объектов на изображении или видео. Например, камеры наблюдения ловко обнаруживают людей и их действия (отсутствие движения, такие предметы, как оружие или нож и т. д.), поэтому подозрительные действия не принимаются во внимание.

Изображение предоставлено: Research Gate

3. Распознавание лиц

Метод распознавания лиц направлен на обнаружение объекта или человеческого лица на изображении. Это одно из сложных применений компьютерного зрения из-за изменчивости человеческих лиц — выражения, позы, цвета кожи, разницы в качестве камеры, положении или ориентации, разрешении изображения и т. д. Однако этот метод широко используется. Смартфоны используют его для аутентификации пользователя. Facebook использует ту же технику, когда предлагает пометить людей на изображении.

распознавание лиц

Изображение предоставлено: Apple

4. Обнаружение края

Обнаружение краев связано с поиском границ объектов на изображении. Это делается путем обнаружения разрывов в яркости. Обнаружение границ может оказать большую помощь в извлечении данных и сегментации изображений.

Обнаружение края

Изображение предоставлено: Википедия

5. Распознавание образов

Распознавание образов — это способность системы обнаруживать расположение характеристик или данных. Здесь шаблон может быть повторяющейся последовательностью данных или набором данных, добавленных в систему.

распознавание образов

Изображение предоставлено: Википедия

6. Классификация изображений

Классификация изображений включает в себя классификацию изображения на основе присутствующего в нем контекстуального визуального содержимого. Процесс включает в себя фокусировку на отношениях соседних пикселей. Система классификации включает базу данных, содержащую предопределенные шаблоны. Эти шаблоны сравниваются с обнаруженным объектом, чтобы классифицировать, что это такое. Классификация изображений имеет важные приложения в таких областях, как навигация транспортных средств, биометрия, видеонаблюдение, биомедицинская визуализация и т. д.

Статья в тему:  Неэтичное исследование: как создать злонамеренный искусственный интеллект

Классификация изображений

Настоящее и будущее компьютерного зрения:

Компьютерное зрение открывает безграничные возможности для потребителей и предприятий. Самоуправляемые автомобили, медицинская диагностика, маркировка изображений, оплата без кассы — вот некоторые из преимуществ технологии компьютерного зрения, которые иллюстрируют ее безграничные преимущества для различных отраслей.

Однако одной из основных проблем при внедрении компьютерного зрения в более крупном масштабе являются большие данные, которые необходимы для обучения. Благодаря лучшим ресурсам, доступным для обучения моделей, компьютерное зрение имеет возможность обойти человеческую способность распознавать, классифицировать и обнаруживать различные изображения/видео.

По сценарию Арчны Оберой

Контент-стратег по профессии и блогер по увлечению, Арчна активно обновляет себя, используя самые свежие технологии и делясь ими с читателями. Оставайтесь с нами, так как она рассказывает несколько популярных историй из технологической области мобильных устройств и Интернета.

голоса
Рейтинг статьи
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
Adblock
detector