Pułapka awatarów. Ciemne strony aplikacji Lensa

Zobacz również:Sztuczna inteligencja tworzy utwory, maluje obrazy i... pisze wiersze. Krótki przegląd tego, jak AI weszła do kultury i sztuki
Lensa
materiały newonce

Stworzenie kilkudziesięciu portretów utrzymanych w różnych stylistykach nigdy nie było prostsze. Narzędzie zbiera pochwały za jakość w stosunku do ceny, ale krytycznie przyglądają mu się specjaliści od cyberbezpieczeństwa, dyskryminacji i… sami artyści.

Tę historię należałoby rozpocząć pod koniec listopada. W tym przypadku nie mamy jednak do czynienia z mocnym wejściem nowości na rynek, tylko z renesansem czegoś, co było już dobrze znane, a teraz wraca z kolejną funkcjonalnością. Aplikacja trafiła do użytkowników w 2018 roku. Wyszła spod rąk Prisma Labs – kalifornijskiego start-upu założonego przez czwórkę rosyjskich programistów. Oleg Poyaganov, Ilya Frolov, Andriej Usoltsev i Aleksiej Moiseenkov najpierw udostępnili Prismę, dzięki której można było przekształcić własne zdjęcia z pomocą wymyślnych efektów specjalnych Z jej pomocą niepozorne selfie przeobrażało się w małe dzieło sztuki utrzymane we wskazanym wcześniej stylu. Pop-art, impresjonizm, a może kubizm? Mnogość opcji robiła na tamte czasy duże wrażenie, redefiniując to, czym były filtry z Instagrama albo te wbudowane w systemy operacyjne smartfonów.

Lensa poszła o krok dalej, choć bazuje na podobnej mechanice. Podstawą działania narzędzia jest Stable Diffusion. Model głębokiego uczenia (deep learning) stał się popularny za sprawą generowania obrazów na podstawie podpowiedzi tekstowych. Tak, bardzo podobnych do tych memicznych autorstwa konkurencyjnego DALL Ze względu na to, że wytrenowano go na miliardach istniejących materiałów, ma dużą skuteczność. Stable Diffusion od niedawna służy także do wizualnych modyfikacji, co szczególnie zainteresowało Prisma Labs.

Z przeciętniaka w superbohatera

Kilka tygodni temu przedsiębiorstwo wzbogaciła Lensę o opcję generowania „magicznych avatarów”. Do jej skutecznego działania aplikacja prosi o wskazanie od 18 do 20 zdjęć z prywatnej biblioteki, zastrzegając, że do uzyskania jak najlepszego rezultatu potrzebuje selfie o wysokiej jakości. Fotografie grupowe, ukazujące całą sylwetkę czy te prezentujące nagie osoby nie zdadzą egzaminu. Następnie otrzymujemy pytanie o płeć i od razu przechodzimy do cennika. Zużywamy ogromną moc obliczeniową, żeby tworzyć dla Was niesamowite portrety. Jest to drogie, ale chcieliśmy zapewnić tak przystępną usługę, jak to tylko możliwe – deklaruje twórcy aplikacji. Największy pakiet magicznych awatarów zawierający 200 unikalnych obrazów kosztuje 23,99 zł – przy założeniu, że aktywujemy tygodniowy, darmowy okres próbny. Za mniejszy, w którym otrzymujemy 50 sylwetek, zapłacimy dwa razy mniej.

Cały proces obróbki trwa dwadzieścia minut. W tym czasie nawet najsprawniejszy karykaturzysta nie skończyłby malować jednego portretu. Szybka przebieżka po instagramowych postach opatrzonym hashtagiem #lensa wskazuje, że aplikacja w większości przypadków spełnia pokładane w niej oczekiwania. Ludzie przeobrażają się w postacie z komiksów, anime albo fantastycznonaukowych blockbusterów. Ich twarze są wymuskane, pozbawione niedoskonałości i przykuwające uwagę. Zupełnie nie dziwi, że Lensa odnotowała znaczący wzrost popularności. W sklepie App Store nadal okupuje wysokie pozycje na listach bestsellerów. Jak podają analitycy z firmy SensorTower, w samym listopadzie pobrano ją 1,6 miliona razy. Co ciekawe, co trzeci nowy użytkownik aplikacji mieszka w Brazylii.

Popis umiejętności

Produkt Prisma Lab to kolejny przykład tego, że sztuczna inteligencja pruje do przodu i staje się coraz lepsza. Pozostaje wyrazisty i zauważony przez media, bo w odróżnieniu do licznych modeli rozwijanych w najgłębszych odmętach Dolinie Krzemowej daje natychmiastowy, satysfakcjonujący efekt. Podobny los spotkał wprowadzony w podobnym czasie ChatGPT. Narzędzie nieodpłatnie udostępniło Open AI – kalifornijskie laboratorium, którego jednym z założycieli poza Elonem Muskiem był Polak, Wojciech Zaremba. Podczas gdy Lensa celuje w wizualność, ten model oparty na językowej bazie GPT-3 (agregującej ponad 175 miliardów parametrów!) wypluwa z siebie teksty stworzone na podstawie podpowiedzi użytkowników. Sugestie mogą dotyczyć nie tylko tematów notek, ale też ich długości oraz stylu. Im więcej osób je wprowadzi, tym rezultaty będą trafniejsze. Ogólnie rzecz biorąc, ChatGPT jest świetnym narzędziem dla osób, które chcą tworzyć chatboty z użyciem sztucznej inteligencji. Jest ono łatwe w obsłudze, elastyczne i pozwala na tworzenie naturalnych i spójnych rozmów. Mały disclaimer: poprzednich dwóch zdań nie napisał człowiek.

Musimy być świadomi za każdym razem, gdy nasze dane biometryczne są wykorzystywane w jakimkolwiek celu. To wrażliwe informacje

David Leslie

ekspert w dziedzinie etyki maszyn, Instytut Alana Turinga

Zapłata w danych

Warto jednak ostudzić entuzjazm, z jakim podchodzimy do obu viralowych narzędzi. Szczególną ostrożność w rozmowie z portalem WIRED zaleca David Leslie, naukowiec na co dzień zajmujący się etyką maszyn i innowacji w londyńskim Instytucie Alana Turinga. Musimy być świadomi za każdym razem, gdy nasze dane biometryczne są wykorzystywane w jakimkolwiek celu. To wrażliwe informacje – tłumaczy. Lensa przyznała w oficjalnym oświadczeniu, że zdjęcia użytkowników są usuwane z serwerów od razu po wygenerowaniu awatarów. Jednocześnie, podobnie jak przeważająca większość aplikacji mobilnych dostępnych na rynku, aplikacja zbiera jednak coś, co Shoshana Zuboff w znakomitej książce Wiek kapitalizmu inwigilacji nazwała nadwyżką behawioralną. Otrzymujemy atrakcyjny i stosunkowo tani produkt, tyle że płacimy czymś więcej niż samymi pieniędzmi.

Lensa zorientuje się, gdzie zrobiliśmy zdjęcia, z jakiego modelu smartfona korzystamy, do jakiej sieci komórkowej należymy i skąd się logujemy. Zanotuje, ile czasu zajęło nam wybranie selfie i podjęcie decyzji o zakupie konkretnego pakietu. Fotografie być może rzeczywiście znikną z chmur Google Cloud Platform i Amazon Web Services, ale te dane pozostaną. Aplikacja wykorzysta je do personalizowania reklam i podsuwania nam kolejnych produktów. W swojej polityce prywatności nie zakłada ich przekazywania innym podmiotom, ale łatwo wyobrazić sobie sytuację, w której w posiadanie całego Prisma Lab wchodzi większy technologiczny potentat. Wtedy intencje mogą być już zupełnie inne.

Człowiek bez twarzy

Dwa lata temu na festiwalu w Sundance odbyła się premiera głośnego dokumentu Zakodowane uprzedzenie, dziś dostępnego na Netfliksie. Jego reżyserka, Shalini Kantanyya, przyjrzała się uważniej temu, w jaki sposób algorytmy uczenia maszynowego i modele sztucznej inteligencji utrwalają stereotypy rasowe i płciowe. W filmie głos zabrała choćby Joy Buolamawini, czarna badaczka z MIT Media Lab. Kobieta wiele razy nie została właściwie zidentyfikowana przez system rozpoznawania twarzy, w iPhone’ach znany jako Face ID. Pozbawieniu możliwości odblokowania telefonu w taki sposób daleko do nierozwiązywalnego problemu. W końcu zawsze można użyć hasła albo kodu. Sęk w tym, że podobne rozwiązania zaczyna stosować się w innych sferach życia, np. przy tropieniu przestępców albo rekrutacji w pracy. Gdy algorytm mylnie przyporządkuje dane grupy albo zignoruje mniejszości, może pozbawić je przywilejów.

Lensa na pierwszy rzut oka nie wpada w tę pułapkę. Ba, stoi nawet w kontrze do niej, bo każdy, niezależnie od koloru skóry albo narodowości, może z niej skorzystać. Posiadanie magicznego awatara zwiększa widzialność niedoreprezentowanych jednostek, a w niektórych przypadkach skutkuje tzw. efektem Proteusza. Naukowcy z Uniwersytetu Stanforda nazwali tak zjawisko polegające na tym, że zdarza nam się odzwierciedlać w rzeczywistości cechy przypisywane naszym cyfrowym odpowiednikom.

Niechciane nudesy

Problematyczny jest jednak fakt, że aplikacja nie jest nieomylna. Tu dołoży komuś dodatkową głowę, tu odetnie kończyny. Poza wypluwaniem pomyłek – budzących raczej śmiech niż trwogę – utrwala też głęboko zakorzenione stereotypy. Wizerunki kobiet bywają w niej nadmiernie seksualizowane, co na własnej skórze odczuła naukowczyni i publicystka Olivia Snow. Lensa nie tylko potrafi generować nagie fotki. Przypisuje też zdjęciom iście karykaturalne cechy, takie jak zmysłowe pozy albo gigantyczne piersi. Sama otrzymałam kilka takich wizerunków, chociaż udostępniłam jedynie swoją twarzopowiada. Aylin Caliskan z Uniwersytetu Waszyngtońskiego zwróciła uwagę na to, że podobne procedery nie występują tak często, gdy awatary mają być męskie. Faceci są kojarzeni przede wszystkim z treściami o charakterze zawodowym, związanymi z karierami w poważanych dziedzinach: prawie, biznesie czy nauce – podkreśla.

Wątpliwości budzi również sposób ukazywania Azjatów. Aplikacja przedstawia tych pierwszych w zunifikowanym, znanym z popkultury anturażu. Najczęściej przypominają wtedy postacie z mang i anime. Liczni czarni użytkownicy Twittera sygnalizowali zaś, że ich cyfrowe wizerunki miały nienaturalnie rozjaśnioną skórę. Przedstawiciele Prismy nie ignorują tych zarzutów, jednak przerzucają odpowiedzialność na zaistniały stan rzeczy i rozkładają ręce. To niefiltrowane, produkowane przez samych ludzi dane wprowadziły model w sieć istniejących uprzedzeń. Przyznajemy, że są obecneskwitował. Od firmy, której powierzamy swoje wizerunki, należałoby oczekiwać większej dbałości o takie szczegóły i kontroli nad dostarczaną usługą. Tymczasem seksualizacji ulegają nawet zdjęcia młodszych użytkowniczek. Lensa pyta o wiek, ale tak jak w przypadku stron pornograficznych albo internetowych sklepów z alkoholem, to to tylko pozorna bramka.

Upokarzające zastąpienie

Z upowszechnienia się magicznych awatarów nie są też zadowoleni sami artyści, zwłaszcza ci zajmujący się grafiką komputerową. W zestawieniu z automatycznym, wydajnym i stale udoskonalanym narzędziem wypadają mniej efektywnie. Wizja, że niektórzy z nich zostaną wyparci przez nowoczesne oprogramowanie, przestała być czysto dystopijną mrzonką. Wspomniane ChatGPT i inne modele generujące teksty już teraz znajdują zastosowanie w tworzeniu użytkowych form: instrukcji, fraz reklamowych albo krótkich notek prasowych. Dwa lata temu pracę w portalu informacyjnym Microsoft News w związku z tym straciło 50 redaktorów. To dość upokarzające, że jakaś maszyna może cię zastąpićmówił jeden ze zwolnionych dziennikarzy w rozmowie z The Seattle Times. Odciążenie ludzi od automatycznej, monotonnej pracy brzmi kusząco, lecz trzeba pamiętać, że muszą znaleźć jakąś alternatywę – czy to w postaci przebranżowienia, czy znalezienia innych źródeł dochodu.

Algorytm może generować atrakcyjne obrazy, ale żyje w odizolowanej przestrzeni. Brakuje mu kontekstu

Ahmed Elgammal

profesor informatyki na Uniwersytecie Rutgersa

Spekulacje dotyczące dalszych przeobrażeń na rynku branży kreatywnej to jedno. Na inną kwestię, która nie dotyczy przyszłości, tylko tego, co tu i teraz, zwrócili uwagę członkowie internetowej platformy ArtStation. Liczni twórcy z całego świata wyrazili swój sprzeciw względem fali sztucznie generowanych grafik, jaka zaczęła zalewać serwis. Uważają, że ich zrównanie z wytworami ludzkiej pracy jest krzywdzące i umniejsza pielęgnowanym przez lata talentom. Co więcej, większość modeli AI wytrenowano na grafikach, obrazach i fotografiach wykonanych przez ludzi. Żadnej z tych osób Prisma Labs nie przypisuje współautorstwa magicznych awatarów, a co za tym idzie, nie mogą one czerpać z nich jakiegokolwiek zysku. – Mimo że artyści poświęcili swój czas i oddali się czemuś bez reszty, ich praca została bezdusznie skradziona, wykorzystana dla zysku bez najmniejszego pojęcia o etycenapisał na swoim profilu na Instagramie Alexander Nanitchkov. To dość dramatyczny komentarz, ale dobrze ukazujący problemy, z którymi będą musieli zmierzyć się prawnicy obyci w nowych technologiach. Komu właściwie wypada przypisać prawa autorskie do cyfrowych dzieł? Twórcom oprogramowania, klientom, a może samej sztucznej inteligencji, której należałoby wówczas nadać podmiotowość?

Ahmed Elgammal, profesor informatyki na Uniwersytecie Rutgersa, uspokaja niepewnych artystów. Algorytm może generować atrakcyjne obrazy, ale żyje w odizolowanej przestrzeni. Brakuje mu kontekstutłumaczy na łamach magazynu American Scientist. Według niego modele AI powinniśmy traktować dlatego jako komplementarne narzędzia. Usprawnią niektóre czynności, jednak do tego, jak je wykonującę, powinniśmy nadal podchodzić z dystansem. Wszak w krytycznym myśleniu i wrodzonej niepewności jeszcze przez długi czas będziemy przewyższać maszyny.

Cześć! Daj znaka, co sądzisz o tym artykule!

Staramy się tworzyć coraz lepsze treści. Twoja opinia będzie dla nas bardzo pomocna.

Podziel się lub zapisz
Pisał lub pisze na łamach „Papaya.Rocks”, „Krytyki Politycznej”, „Kontaktu”, „Gazety Magnetofonowej” i „NOIZZ”. Lubi reportaże, muzykę elektroniczną i kino. Występował w „Kole Fortuny”, gdzie Rafał Brzozowski zagiął go hasłem „tatuaż tymczasowy”.
Komentarze 0