После того, как амбиции Metaverse потерпели крах, Meta обращается к искусственному интеллекту для следующего этапа своего развития. Один из последних проектов Meta, о котором гигант социальных сетей объявил в среду, называется Segment Anything Model.
Segment Anything помогает пользователям определить конкретные предметы на изображении с помощью нескольких щелчков мыши. Пока еще в демонстрационном режиме, компания утверждает, что Segment Anything уже может сделать фотографию и индивидуально определить пиксели, из которых состоит все на изображении, чтобы можно было отделить один или несколько предметов от остальной части изображения.
Мета вступает в игру с SAM
Segment Anything Model (SAM) — это система сегментации с подсказками. Она может «вырезать» любой объект на любом изображении одним щелчком мыши.
Маски можно отслеживать в видео, использовать в приложениях для редактирования изображений и даже поднимать в 3D.
Быстрый тур и тест pic.twitter.com/YC0JSWYy9X
— Ник Сент-Пьер (@nickfloats) Апрель 5, 2023
«Сегментация — определение того, какие пиксели изображения принадлежат объекту — является основной задачей компьютерного зрения и используется в широком спектре приложений, от анализа научных изображений до редактирования фотографий», — написала Meta в сообщении, анонсирующем новую модель.
По словам Meta, создание точной модели сегментации для конкретных задач требует высокоспециализированной работы технических экспертов, имеющих доступ к инфраструктуре обучения ИИ и большим объемам тщательно аннотированных данных.
«Мы добиваемся большей обобщенности по сравнению с предыдущими подходами за счет сбора нового набора данных беспрецедентного размера». Росс Гиршик, научный сотрудник Meta, сообщил TCN в электронном письме. «Крайне важно, что в этом наборе данных мы не ограничивали типы объектов, которые мы аннотировали».
«Благодаря масштабу данных и их обобщенности, наша результирующая модель демонстрирует впечатляющие возможности для обработки типов изображений, которые не были замечены во время обучения, таких как эгоцентрические изображения, микроскопия или подводные фотографии», — добавил Гиршик.
Генерирующий искусственный интеллект — это система искусственного интеллекта, которая генерирует текст, изображения или другие медиа в ответ на подсказки. Одними из наиболее ярких примеров этой технологии являются ChatGPT от OpenAI и платформа цифрового искусства Midjourney.
Meta утверждает, что система Segment Anything AI была обучена на более чем 11 миллионах изображений. Как объяснил Гиршик, Meta предоставляет Segment Anything исследовательскому сообществу под разрешительной открытой лицензией Apache 2.0, доступ к которой можно получить через Segment Anything Github.
«Ключевым аспектом законов о конфиденциальности является то, что сбор данных должен осуществляться прозрачно и с полного согласия человека», — сказал TCN Лайл Соломон, главный юрист Oak View Law Group. «Использование ИИ для распознавания лиц без прямого согласия вызывает вопросы о потенциальных нарушениях закона о неприкосновенности частной жизни. Кроме того, компаниям следует избегать передачи данных о лице третьим лицам без согласия человека, а любая передача должна соответствовать положениям закона о защите частной жизни».
Гиршик говорит, что Segment Anything находится на стадии исследования и не планирует использовать его в производстве. Тем не менее, существуют опасения, связанные с неприкосновенностью частной жизни при потенциальном использовании искусственного интеллекта.
В феврале компания Meta отказалась от планов по запуску метавселенной и сосредоточилась на других продуктах, включая искусственный интеллект, объявив о создании новой продуктовой группы, ориентированной на генеративный ИИ. Это изменение произошло после того, как компания уволила более 10 000 работников после прекращения проекта Instagram NFT.
Глобальные лидеры, уставшие от развития искусственного интеллекта, выразили обеспокоенность и начали расследование технологии и того, что она означает для конфиденциальности и безопасности пользователей после запуска ChatGPT от OpenAI. Италия уже запретила популярного чатбота.
«Многие пользователи не понимают, как работает этот процесс и какие последствия могут быть в долгосрочной перспективе, если их лицо используется для обучения модели машинного обучения без их согласия», — сказала TCN Кристен Руби, президент компании Ruby Media Group, занимающейся консультациями в области социальных медиа и А.И..
«Самой большой проблемой для многих компаний является получение доступа к крупномасштабным обучающим данным, и нет лучшего источника обучающих данных, чем те, которые люди предоставляют в социальных сетях», — сказала она.
Руби предлагает проверить, включила ли компания положение о машинном обучении, которое информирует пользователей о том, как используются их данные, и могут ли они отказаться от будущих моделей обучения. Она отмечает, что в настоящее время многие компании по умолчанию используют настройку opt-in, но в будущем она может измениться на opt-out.
«Мы используем различные методы сохранения конфиденциальности, такие как размытие лиц и другой персонально идентифицирующей информации (например, номерных знаков)», — сказала Гиршик. «Пользователи могут сообщить нам об оскорбительном контенте, отправив письмо по адресу [email protected] с указанием идентификатора изображения, и мы удалим его из набора данных. «