Dyplomacja maszyn. Bot sam nauczył się równoważyć oszustwo i uczciwość

Cywilizacja

Dyplomacja maszyn. Bot sam nauczył się równoważyć oszustwo i uczciwość

piątek, 16 grudnia 2022

Udostępnij:

Sztuczna inteligencja (AI) już dawno pokonała człowieka w szachach, teraz przyszedł czas na dyplomację, choć ta jest wielką sztuką. Wymaga nie tylko strategii, lecz także intuicji, perswazji, a nawet podstępu – zatem ludzkich umiejętności. Tymczasem bot CICERO gra w „Dyplomację” lepiej od 90 procent graczy-ludzi. Czy brak emocji w komunikacji pomoże maszynie manipulować ludźmi? Czy nie oglądając mowy ciała innych, daje się przejrzeć ich stan umysłowy? Czy AI będą zdolne do współpracy, a nie tylko konkurencji?

Meta ma liczne kłopoty opisywane w mediach, ale niektóre rzeczy się jej udają. Na przykład skonstruowanie bota CICERO. W niedawnym numerze magazynu „Science” ludzie z Meta Fundamental AI Research Diplomacy Team (FAIR) wraz z 26 innymi informatykami opublikowali wyniki testów przeprowadzonych w świecie realnym (co nie oznacza, że nie jest to świat gry internetowej) z udziałem tworzonego od kilku lat agenta AI, którego celowo nazwano od imienia Cycerona. Od starożytności w szkołach w Europie uczono się na pamięć mów Cycerona, stosowano jego sposób wysławiania się, argumenty i figury retoryczne, aby przekonać słuchaczy do własnych racji. A że to już nie XIX wiek, warto więc objaśnić, że Marek Tulliusz Cycero był politykiem, retorem, pisarzem, dowódcą wojskowym, filozofem, a nawet kapłanem. Żył w I wieku p.n.e., czyli w burzliwych czasach, gdy z Republiki Rzymskiej wykuwało się Cesarstwo.

Cyceron jako polityk i wódz stojący na czele stronnictwa broniącego Republiki przeciw Cezarowi, Antoniuszowi i Oktawianowi, poniósł klęskę. Jako mówca i pisarz już za życia podziwiany nawet przez wrogów, odniósł jednak wielki sukces „w literaturze”. Może dlatego wybrano go na patrona bota Mety. CICERO to bowiem pierwszy »agent AI, który osiągnął wydajność na poziomie człowieka w „Dyplomacji”, grze strategicznej obejmującej zarówno współpracę, jak i rywalizację, która kładzie nacisk na negocjacje w języku naturalnym i koordynację taktyczną między siedmioma graczami«. A zatem bot nie tylko naśladuje ludzki język i używa go do komunikacji z ludźmi, ale „integruje model językowy z algorytmami planowania i uczenia się”, z rozmów wyciąga wnioski na temat przekonań i intencji innych graczy, a w celu realizacji swoich planów inicjuje dialog. Co więcej, robi to lepiej, niż 90 proc. ludzkich fanów „Dyplomacji”.

Sztuczna inteligencja już sama maluje, komponuje, pisze powieści, a nawet wiersze i haiku. Dla nas ludzi to, co się dzieje „pod maską” AI , jak dochodzi do pewnych umiejętności i decyzji, pozostaje tajemnicą. Rzecz jasna najpierw mądre umysły ludzkie konstruują informatyczny szkielet takiej AI – jej „silnik” – a potem wrzucają do niego gigantyczny zestaw danych, dobrany przez specjalistów z jakiejś dziedziny, z poleceniem: pooglądaj sobie bocie i wyciągnij wnioski. Dobrze skonstruowany bot potrafi wyspecjalizować się na różnych polach: rozpoznawania i analizowania konkretnego typu obrazów czy dźwięków, analizy gigantycznej korporacyjnej księgowości w połączeniu z HR i R&D, naśladowania stylu Lwa Tołstoja czy Rafaela, wreszcie komunikowania się z żywym człowiekiem tak, by ten nawet nie wiedział, że ma do czynienia z botem. Jednak sztuka dyplomacji…

Czy w przyszłości zastąpienie niektórych urzędników przez AI jest możliwe, czy zmieniłoby jakość dyplomacji i czy w ogóle taka gra ma coś wspólnego z realną służbą dyplomatyczną? Prof. Arkady Rzegocki, Szef Służby Zagranicznej RP jest przekonany, że nie. – Sztuczna inteligencja ma bardzo duże zastosowanie, z roku na rok coraz większe. Świat dyplomacji korzysta oczywiście ze zdobyczy cyfrowych, np. w sytuacjach kryzysowych. Jednak AI z pewnością nie będzie potrafiła zastąpić profesjonalnej kadry dyplomatycznej. Dyplomacja bowiem w dużej mierze opiera się na zaufaniu i osobistych kontaktach, a tego nigdy nie zastąpi nawet najlepsza maszyna – stwierdza ambasador.

Cóż, artyści czy radiolodzy nadal też tak mówią, tylko coraz słabszym głosem. Jest jednak jasne, że ci nie opierają swoich specjalności na osobistych kontaktach z klientami czy pacjentami.

AI zjada europejski tort

Nie da się też ukryć, że gra „Dyplomacja” to w zasadzie tylko erzac prawdziwej dyplomacji, choć wielkim fanem tej gry jest Henry Kissinger. Ten wiekowy doradca strategiczny, były sekretarz stanu i dyplomata amerykański, rzekłbyś Talleyrand naszych czasów, ma szansę być jej miłośnikiem od 63 lat, wtedy bowiem weszła ona na amerykański rynek jako planszowa, strategiczna „gra wojenna”. Jej gracze należą do podobnie elitarnej grupy, co szachiści. Zrzeszają się w kluby, organizują lokalne i międzynarodowe turnieje „Dyplomacji”, gdzie pula nagród może przyprawiać o zawrót głowy prostych fanów chińczyka, czy nawet scrabble.

ODWIEDŹ I POLUB NAS

Gra przez dekady funkcjonowała w formie listownej, potem mailowej i oczywiście komputerowej, a wreszcie internetowej. Aczkolwiek ta ostatnia jeszcze dekadę temu nie była szczególnie ceniona przez graczy, którzy – podobnie jak szachiści – chcieliby się zmierzyć z AI. Brakowało w niej bowiem stosownej emulacji mowy czy okien dialogowych umożliwiających sensowną grę ludzi przeciw botom. Brakowało też botów na tyle sprawnych, by w ogóle do niej zasiąść.

Co udało się uzyskać CICERO, skoro wbił się do grona 10 proc. najlepszych graczy? „Dyplomacja” różni się od typowych gier wojennych w kilku kluczowych elementach. Nie ma tu tur i kolejności: gracze potajemnie zapisują swoje ruchy po okresie negocjacji, a następnie wszystkie ruchy są ujawniane i wprowadzane w życie jednocześnie. Zasady symulujące walkę są strategiczne i abstrakcyjne, a nie taktyczne i realistyczne, bo to nie symulacja wojskowa. Ponadto, każda jednostka wojskowa, lądowa czy morska ma taką samą siłę. Plansza do gry jest w skali całego kontynentu (Europa AD 1901 plus Turcja, kawałek Bliskiego Wschodu i Północnej Afryki, gdzie mocarstwem wyposażonym w więcej niż trzy armie jest jedynie Rosja), a nie pojedynczej kampanii militarnej. Wreszcie zaś – rozstrzygnięcie walki nie zawiera elementów losowych, jak rzut kośćmi czy dobieranie kart. To zdolności do interakcji społecznej i umiejętności interpersonalne stanowią o sukcesie w „Dyplomacji”.

Co myśli AI? Może uzyskała świadomość, na pewno dobrze udaje ludzi

Jej kod działa jak ludzki mózg. Zdaniem programisty Googla jego chat-bot „odczuwa”.

zobacz więcej

W najważniejszej dla powodzenia w rozgrywkach fazie negocjacji, gracze omawiają taktykę i strategię, tworzą sojusze, dzielą się danymi wywiadowczymi lub szerzą dezinformację. Negocjacje mogą być upublicznione lub prywatne. Siedmiu graczy nie jest zobowiązanych do niczego, co mówią lub obiecują – umowy nie są wiążące. Jednak zaufanie jest bardzo ważne. Gracze muszą zawiązywać sojusze i obserwować działania swych aliantów, aby ocenić ich wiarygodność. Jednocześnie muszą przekonać innych o własnej wiarygodności, planując zwrócenie się przeciwko swoim sojusznikom w najmniej oczekiwanym momencie. Zdrada może być tak samo opłacalna jak trwały, niezawodny sojusz. Celem jest oczywiście zagarnięcie dla siebie jak największej porcji europejskiego tortu i centrów zaopatrzenia, ale nie da się tego zrobić tylko walcząc w polu. Trzeba to niemal dosłownie wynegocjować i wymanipulować, aż się ma siniaka w ustach.

Tu zaś staje w szranki CICERO, który łączy w sobie moduły rozumowania strategicznego i dialogu, trenowane na zbiorach danych (ruchy graczy oraz transkrypty negocjacji) ze 125 261 rozgrywek „Dyplomacji” wyjętych z internetu. Dokładnie tak, jakby uczono go gry w szachy. W szachy już dawno AI pokonała człowieka, czas przyszedł na dyplomację, choć jest sztuką. Wymaga nie tylko strategii, ale także intuicji, perswazji, a nawet podstępu – ludzkich umiejętności, które wydawały się niedostępne nawet dla najpotężniejszych AI. Informatyk z Meta i współautor artykułu w „Science” Noam Brown zaczynając ów projekt w 2019 roku myślał, że sukces będzie wymagał dekady. „Pomysł, że można mieć sztuczną inteligencję, która omawia strategię z inną osobą, planuje wszystko, negocjuje i buduje zaufanie, wydawał się science fiction”.

„Pokerowa twarz” bota

Tymczasem bot dość szybko nauczył się wybierać działania na podstawie stanu gry, poprzedniego dialogu i przewidywanych działań innych graczy, planując kilka ruchów do przodu. Podczas treningu naukowcy nagradzali go również za „granie po ludzku”, aby jego działania nie dezorientowały innych graczy. Moduł dialogowy wyszkolono do naśladowania ludzkiej konwersacji w grze, w kontekście jej stanu, poprzedniego dialogu i tego, co zamierzał zrobić moduł planowania strategicznego. CICERO ma zatem zdolność do wieloetapowego planowania komunikacji oraz mówienia i gry w ludzkiej konwencji.

Agent, jak twierdzą jego twórcy, sam nauczył się równoważyć oszustwo i uczciwość. Nauczył się z tych tysięcy przykładów gier odbytych przez ludzi jak kłamać, by nie przegiąć, by nie stracić zaufania na zawsze. I jak mówić prawdę, by nie zostać uznanym za głupca. Aczkolwiek, gdy na transkrypty CICERO spojrzeli eksperci ds. dyplomacji, ocenili jakieś 10 proc. wiadomości bota jako niezgodnych z planem lub stanem gry. Co bystrzejszy gracz mógł uznać, że bot gada bzdury. My ludzie miewamy jednak tendencję do dopatrywania się podstępu w słyszanych farmazonach, na zasadzie „w tym szaleństwie pewno jest metoda, tylko jaka?”. Tym mechanizmem gracze tłumaczyli sobie zapewne dziwne wiadomości CICERO, zwłaszcza iż większość nie miała pojęcia, że ich przeciwnik jest botem.

Gdy patrzy na to psycholog (ciekawe, czy boty doczekają się swoich terapeutów), rzecz cała jest przejawem kreatywności agenta, czyli znajdowania nowych strategii. Ma to związek z plastycznością i giętkością, co daje się oszacowywać testami badającymi inteligencję bazującą na kreatywności, a nie wiedzę wyuczoną w szkole. I choć nasza komunikacja jest mniej lub bardziej naładowana emocjonalnie, zaś boty nie bardzo mogą odczuwać emocje (od motyli w brzuchu po szum w głowie), to właśnie „twarz pokerzysty” jest tym, co musimy szkolić, jeśli chcemy być dyplomatami. Innymi słowy: zalana łzami reakcja ambasadora Ukrainy Andrija Mylnyka na niemieckie dictum, iż „nie ma po co wam pomagać, skoro za kilka godzin was nie będzie”, była głęboko ludzka, ale leżała na antypodach dyplomacji. Oczywiście same te słowa płynące od urzędników niemieckiego MSZ też nie były dyplomatyczne w żadnym calu, a dodatkowo były nieludzkie.

Czy zatem brak emocji w komunikacji będzie pomagał botowi – co tu kryć – manipulować ludzkimi graczami? Czy nie mając własnej twarzy i nie oglądając mowy ciała innych daje się przejrzeć ich stan umysłowy? Wyczuć, kto mówi prawdę, a kto kłamie, kto jest szczery, a kto manipuluje, co robimy częstokroć podprogowo, a nazywamy intuicją? Czy wystarczy do tego informacja z dialogu i tembru głosu ludzkiego gracza – okazuje się, że owszem. W każdej dziedzinie – niezależnie od dzisiejszej mody, by być „wyluzowanym” w każdym calu – maniery i konwencje zwykle ułatwiają interakcje, a owych można nauczyć tak dziecko, jak i AI.

Z innej beczki jest pytanie, czy trenowane na „Dyplomacji” boty będą zdolne do choćby chwilowych kooperacji, do współpracy a nie konkurencji i jak będą się czuli ludzie zawiązujący alianse z maszynami? Badacze trenowali moduł rozumowania strategicznego, zmuszając agenta do gry przeciwko swoim kopiom. Gdyby miał pomagać ludziom negocjować ceny na aukcjach czy wydębiać promocje i ulgi w ramach kontaktów z równie botycznymi dziś działami obsługi klienta (nastawionymi na ogół na „nie”, lub na szybkie danie ochłapu zamiast należącej się refundacji), będzie konkurował. Jednak agenci-negocjatorzy, którzy mieliby przekonywać ludzi do dokonywania zdrowych wyborów, chociażby dietetycznych, czy pomagać skonfliktowanym politykom, musieliby nauczyć się współpracy, uwspólniania strategii i dzielenia się otwarcie pomysłami.

Zagrożenia? Agenci AI mogą manipulować poglądami politycznymi, dokonywać oszustw finansowych lub wydobywać poufne informacje. I kogo wtedy wsadzić za szpiegostwo, malwersację czy zdradę stanu? Najprościej byłoby zakończyć te opowieść, że po szachach, Go, pokerze i Dota 2, AI zaczęło ogrywać ludzi w „Dyplomacji”. Mam jednak wrażenie, że ani nie na tym polega istota tego osiągnięcia informatyków z Mety, ani na tym się nie kończy.

– Magdalena Kawalec-Segond

TYGODNIK TVP, ul. Woronicza 17, 00-999 Warszawa. Redakcja i autorzy

Źródło: https://www.science.org/doi/10.1126/science.ade9097

Cywilizacja

Dyplomacja maszyn. Bot sam nauczył się równoważyć oszustwo i uczciwość

Co myśli AI? Może uzyskała świadomość, na pewno dobrze udaje ludzi

Legendy o „cichych zabójcach”

Pamiętny rok 2023: 1:0 dla dyktatur

Kasta, i wszystko jasne

Jak Kościół katolicki budował demokrację amerykańską

Budynki plomby to plaga polskich miast