With its Metaverse ambitions in shambles, Meta is now looking to AI to drive its next stage of development. Jeden z najnowszych projektów Mety, ogłoszony w środę przez giganta mediów społecznościowych, nazywa się Segment Anything Model.
Segment Anything pomaga użytkownikom zidentyfikować konkretne elementy na obrazie za pomocą kilku kliknięć. Choć wciąż w trybie demo, firma twierdzi, że Segment Anything może już zrobić zdjęcie i indywidualnie zidentyfikować piksele składające się na wszystko na zdjęciu, dzięki czemu można oddzielić jeden lub więcej elementów od reszty obrazu.
Meta zbliża się wielkimi krokami dzięki SAM
Segment Anything Model (SAM) to system segmentacji z możliwością podpowiadania. Może on „wyciąć” dowolny obiekt, na dowolnym obrazie, za pomocą jednego kliknięcia.
Maski mogą być śledzone w filmach, umożliwiają aplikacje do edycji obrazów, a nawet mogą być podnoszone do 3D
Quick tour and test pic.twitter.com/YC0JSWYy9X
– Nick St. Pierre (@nickfloats) 5 kwietnia 2023
„Segmentacja – identyfikacja, które piksele obrazu należą do obiektu – jest podstawowym zadaniem w wizji komputerowej i jest wykorzystywana w szerokim zakresie zastosowań, od analizy obrazów naukowych po edycję zdjęć” – napisała Meta w poście zapowiadającym nowy model.
Meta powiedziała, że stworzenie dokładnego modelu segmentacji dla konkretnych zadań wymaga wysoce wyspecjalizowanej pracy ekspertów technicznych z dostępem do infrastruktury szkoleniowej AI i dużych ilości starannie opisanych danych in-domain.
„Osiągamy większą generalizację niż poprzednie podejścia poprzez zebranie nowego zbioru danych o niespotykanej dotąd wielkości”. Ross Girshick, naukowiec w Meta, powiedział TCN w e-mailu. „Co kluczowe, w tym zbiorze danych nie ograniczaliśmy typów obiektów, które anotowaliśmy.
„Dzięki skali danych i ich ogólności, nasz wynikowy model pokazuje imponujące zdolności do obsługi typów obrazów, które nie były widziane podczas szkolenia, takich jak obrazy egocentryczne, mikroskopia czy zdjęcia podwodne” – dodał Girshick.
Generatywna sztuczna inteligencja to system A.I., który generuje tekst, obrazy lub inne media w odpowiedzi na podpowiedzi. Niektóre z najbardziej znanych przykładów tej technologii to ChatGPT firmy OpenAI i platforma sztuki cyfrowej Midjourney.
Meta twierdzi, że system Segment Anything AI został wytrenowany na ponad 11 milionach obrazów. Jak wyjaśnił Girshick, Meta udostępnia Segment Anything dla społeczności badawczej na permisywnej, otwartej licencji Apache 2.0, do której dostęp można uzyskać poprzez Segment Anything Github.
„Kluczowym aspektem przepisów dotyczących prywatności jest to, że gromadzenie danych musi odbywać się w sposób przejrzysty i za pełną zgodą osoby fizycznej”, powiedział TCN Lyle Solomon, główny prawnik w Oak View Law Group. „Wykorzystanie AI do rozpoznawania twarzy bez wyraźnej zgody rodzi pytania o potencjalne naruszenie prawa prywatności. Dodatkowo, firmy powinny unikać udostępniania danych o twarzy stronom trzecim, chyba że osoba fizyczna wyraziła na to zgodę, a każde udostępnienie musi być zgodne z przepisami prawa prywatności.”
Girshick mówi, że Segment Anything jest w fazie badań i nie ma planów wykorzystania go w produkcji. Nadal istnieją obawy związane z prywatnością w potencjalnych zastosowaniach sztucznej inteligencji.
W lutym Meta pivoted od swoich planów uruchomienia metaverse, aby skupić się na innych produktach, w tym sztucznej inteligencji, ogłaszając utworzenie nowej grupy produktowej skupionej na generatywnym A.I. Ta zmiana nastąpiła po tym, jak firma zwolniła ponad 10 000 pracowników po zakończeniu swojego projektu Instagram NFT.
Globalni liderzy, znużeni postępem sztucznej inteligencji, wyrazili obawy i otworzyli dochodzenia w sprawie technologii i tego, co oznacza ona dla prywatności i bezpieczeństwa użytkowników po uruchomieniu ChatGPT OpenAI. Włochy już zakazały popularnego chatbota.
„Wielu użytkowników nie rozumie, jak działa ten proces lub jakie mogą być jego konsekwencje w dłuższej perspektywie, jeśli ich twarz jest wykorzystywana do trenowania modelu uczenia maszynowego bez ich zgody” – powiedziała TCN Kristen Ruby, prezes firmy konsultingowej Ruby Media Group zajmującej się mediami społecznościowymi i A.I.
„Największym wyzwaniem dla wielu firm jest uzyskanie dostępu do danych szkoleniowych na dużą skalę, a nie ma lepszego źródła danych szkoleniowych niż to, co ludzie dostarczają w sieciach mediów społecznościowych” – powiedziała.
Rubin sugeruje sprawdzenie, czy firma zawarła klauzulę dotyczącą uczenia maszynowego, która informuje użytkowników, w jaki sposób ich dane są wykorzystywane i czy mogą zrezygnować z przyszłych modeli szkoleniowych. Zauważa, że wiele firm ma obecnie domyślne ustawienie opt-in, ale może to się zmienić na opt-out w przyszłości.
„Zastosowaliśmy różne techniki ochrony prywatności, takie jak rozmycie twarzy i innych informacji identyfikujących osobę (np. tablic rejestracyjnych)” – powiedziała Girshick. „Użytkownicy mogą zgłaszać nam obraźliwe treści, wysyłając e-mail na adres [email protected] z id zdjęcia, a my usuniemy je ze zbioru danych. „