Piotr WITEK
Cyfrowa audiowizualność a historia
Technologia AI DeepFake
Wiara w autentyczność i wiarygodność analogowych filmów ukazujących na ekranie fragmenty społecznej rzeczywistości towarzyszyła tej technologii niemal od początku jej powstania. Na bazie owej wiary zrodziło się przekonanie o indeksalnym związku pomiędzy obrazem i filmowanym światem, a tym samym o wartości poznawczej audiowizualnych przekazów i ich użyteczności dla badań naukowych, szczególnie historycznych[1].
Pionier kinematografii Bolesław Matuszewski w 1898 r. konstatował:
Można twierdzić, że żywa fotografia posiada cechy autentyczności, dokładności, precyzji, jej tylko właściwe. Jest ona świadkiem naocznym par excellence, wiarygodnym i nieomylnym. […] należałoby sobie życzyć, aby inne dokumenty historyczne zawierały w tym samym stopniu nieomylność i prawdę[2].
W podobnym tonie, jeszcze w latach siedemdziesiątych XX w., wypowiadał się jeden z historyków, Lino Micciche:
Prawdziwym, jedynym „filmem historycznym” w pełnym znaczeniu tego słowa może być film, który odtwarza epokę, zdarzenie, postać w oparciu o obrazy kroniki filmowej zarejestrowane w danej epoce, z okazji danego zdarzenia, w obecności danej postaci. Ich zestawienie, selekcja i swobodny montaż będą z pewnością sugestywnym dziełem autora, wyrażającym nieuchronnie, wręcz koniecznie, punkt widzenia dnia dzisiejszego, ale „przeżycie” w tych obrazach, na których opiera się dyskurs, jest przeżyciem Historii, to jest świata i ludzi, a nie tylko przeżyciem realizacji filmowej, która jednakowo odczuwa fikcję i rzeczywistość i je ze sobą miesza, zrównuje i wymienia. „Film historyczny”, przynajmniej tu i teraz, robi się z prawdziwych obrazów historii[3].
Pomimo przekonania o oczywistej, jak mogłoby się wydawać, wartości poznawczej filmu, przez dekady był on przez historyków ignorowany jako potencjalne źródło historyczne oraz narzędzie wytwarzania wiedzy o przeszłości. Od tego stanowiska zdarzały się pewne wyjątki, które jednak nie uformowały się w nowy trend badawczy[4].
Za przykład takiego wyjątkowego podejścia do filmu może posłużyć konstatacja Jana Lewandowskiego z 1980 r.:
Pojawiła się mianowicie propozycja, aby historycy nie ograniczali się do roli konsultantów, lecz podejmowali realizację filmów dokumentalnych o pełnej kwalifikacji naukowej. Zarysowuje się więc perspektywa historyka, który z archiwum taśm montuje film przedstawiający jego ocenę wydarzeń. Że sprawa nie jest jedynie fantazją, świadczyć może precedensowy przypadek Joachima Festa, autora kilu książek o faszyzmie, który zrealizował w oparciu o zachowane taśmy z lat trzydziestych głośny film Hitler – historia pewnej kariery, dając w nim własną ocenę Hitlera i narodowego socjalizmu. Możliwość tworzenia autorskich filmów dokumentalnych przez historyków zdaje się perspektywą realną. Mając do pomocy dobrych montażystów, historyk mógłby pokusić się o własny wykład filmowy dziejów najnowszych. Zapewne wielu widzów chętnie obejrzałoby takie dokumenty podpisane nazwiskami wybitnych specjalistów[5].
Z czasem pod wpływem rozmaitych okoliczności związanych z rozwojem technologii oraz krytycznej refleksji w obszarze nauki naiwne przeświadczenie o niejako automatycznej autentyczności i wiarygodności filmowych obrazów, którą gwarantować miała technologia pozwalająca rejestrować na celuloidowej taśmie świat znajdujący się przed kamerą, ustępowało krytycznemu przekonaniu o filmie jako wytworze kultury, uwikłanym w szereg przeróżnych współrzędnych: konwencji, stylów, rozwiązań technicznych itd. W filmach dostrzeżony został komponent kreacyjny – konstruktywistyczny.
Filmy wykorzystywane w funkcji źródła z pewnym trudem poddawane były (i nadal są) przez historyków procedurom krytyki zewnętrznej i wewnętrznej oraz analizom i interpretacjom. Owa trudność wynikała i dalej wynika z tego, że na gruncie historiografii nie wypracowano adekwatnych narzędzi krytycznej refleksji o filmie z powodu braku teoretycznych i metodologicznych kompetencji historyków, uniemożliwiających teoretyczny namysł nad tym, w jaki sposób badawczo i poznawczo postępować ze źródłami audiowizualnymi – w tym filmowymi.
U schyłku XX w. film coraz częściej stawał się poważnym przedmiotem zainteresowania historyków. Nie tylko zaczęto traktować filmowy przekaz jako istotne źródło historyczne, ale także jako potencjalną alternatywną wobec historiografii formę badania i reflektowania przeszłości oraz prezentowania wiedzy historycznej za pomocą ekranowych wizualizacji[6].
Film jest medium niezwykle sugestywnym. Prezentowana za pomocą filmu historia często była i jest niebywale przekonująca. Tym samym film jest bardzo efektywnym środkiem perswazji historycznej, politycznej, społecznej. Ma ogromny wpływ na kształtowanie świadomości historycznej, wyobrażeń o świecie przeszłym i współczesnym, co pociąga za sobą określone konsekwencje. Wywołując reakcje widzów, obrazy filmowe stają się / mogą stawać się sprawcze[7]. Spektakularnym przykładem siły oddziaływania kina może być film Agnieszki Holland Zielona granica (2023).
Technologia filmowa pozwalała tworzyć niezwykle sugestywne, wyglądające na autentyczne i wiarygodne obrazy przeszłości za pomocą różnego rodzaju efektów technicznych i środków estetycznych (np. technika bluescreen, podwójnej ekspozycji, reprodukowanie/naśladowanie dawnych konwencji filmowych) w niemal nieograniczony sposób już w epoce kina analogowego. Za spektakularny przykład może posłużyć film A. Wajdy Człowiek z marmuru z 1976 r., w którym reżyser wykorzystał konwencję kroniki filmowej, by wykreować za jej pomocą niezwykle przekonujący, wyglądający na autentyczny i wiarygodny obraz świata lat pięćdziesiątych. Na ekranie, w filmie stylizowanym na Polską Kronikę Filmową, mogliśmy oglądać fikcyjnych bohaterów, Mateusza Birkuta i jego żonę, w otoczeniu postaci znanych z historii, takich jak np. Bolesław Bierut. W Człowieku z marmuru mamy do czynienia z wykreowanymi na potrzeby filmu obrazami charakteryzującymi się precyzyjnym reprodukowaniem strategii narracyjnych i wizualizacyjnych PKF, a tym samym upodobnieniem ich do kronik autentycznych, a przez to estetycznym uautentycznieniem i uhistorycznieniem[8].
***
Pojawienie się i upowszechnienie w kinie w latach dziewięćdziesiątych cyfrowych technologii otworzyło przed filmem nowe możliwości. Cyfrowe obrazy (w tym cyfrowe fotorealistyczne animacje realizowane w technologii CGI) stały się bardziej plastyczne i podatne na wszelkiego rodzaju zabiegi kreacyjne, mające na celu uzyskanie efektów uautentyczniania i uhistoryczniania samych obrazów oraz ekranowych światów przedstawionych. W filmie Forrest Gump z 1994 r. w reżyserii Roberta Zemeckisa tytułowy bohater występuje w archiwalnych kronikach z lat sześćdziesiątych– siedemdziesiątych obok prezydentów USA. Tu także mamy do czynienia z reprodukcją strategii wizualizacyjnych archiwalnych filmów / materiałów telewizyjnych z lat sześćdziesiątych–siedemdziesiątych. Różnica w stosunku do filmu Wajdy polega na tym, że u Zemeckisa cyfrowa technologia (bluescreen i cyfrowy montaż cyfrowych ujęć) umożliwiła wkomponowanie fikcyjnej postaci głównego bohatera w świat przedstawiony na archiwalnych kronikach w tak precyzyjny sposób, że na ekranie możemy zobaczyć, jak wchodzi on w bezpośrednią interakcję z postaciami historycznymi. Spektakularnym przykładem tego zabiegu jest scena, w której Tom Hanks w roli Forresta Gumpa ściska dłoń prezydenta JFK.
Do niedawna na używanie w produkcji filmowej zabiegów takich jak pokrótce opisane wyżej mogły sobie pozwolić jedynie wielkie studia filmowe i stacje telewizyjne. Technologia umożliwiająca stosowanie spektakularnych efektów technicznych była bardzo droga, wymagała specjalistycznego sprzętu oraz ekspertów potrafiących ją wdrożyć. Dla przeciętnego miłośnika wideofilmowania, w tym historyka, była całkowicie nieosiągalna. Współcześnie, wraz z rozwojem takich platform jak YouTube, Vimeo, pojawieniem się na rynku wysokiej jakości kamer cyfrowych oraz zaawansowanych funkcjonalnie aplikacji do nieliniowej edycji wideo i audio (choćby takich jak Davinci Resolve Studio, Adobe Premiere Pro, Vegas Pro, Shotcut, Reaper, Ableton, Audacity) w rozsądnych cenach lub otwarto-źródłowych, sytuacja uległa diametralnej zmianie. Efekty techniczne, np. takie jak blue/greenscreen, maskowanie, tracking, nakładanie filtrów, koloryzowanie obrazów, equalizacja dźwięku, przestały być jedynie domeną wielkich wytwórni medialnych. Cyfrowy film z użyciem technologii greenscreen i pięciokanałową ścieżką dźwiękową można zrobić we własnym domu, siedząc przed komputerem, do którego podłączona jest cyfrowa kamera i mikrofon.
Cyfrowa audiowizualność otwiera przed historykami nowe możliwości tworzenia profesjonalnych, naukowych, badawczych i edukacyjnych filmów historycznych bez konieczności uciekania się do pomocy filmowych studiów czy „Ghostfilmmakerów”, którzy wykonają za nich całą pracę realizacyjną. Samowystarczalność historyków w tworzeniu filmowych narracji historycznych jest niezwykle istotna. Na co dzień historycy, tworząc pisane narracje historyczne, robią to samodzielnie, nie zatrudniają do pisania naukowych artykułów czy monografii „Ghostwriterów”[9]. Mając na uwadze, że cyfrowa audiowizualność stała się stałym elementem naszej codzienności, oczywistym wydaje się, że historycy powinni umieć się w niej poruszać i być w stanie tworzyć naukowe narracje historyczne za pomocą narzędzi, jakie oferuje kultura cyfrowa. Aby było to możliwe, konieczne jest wprowadzenie na uniwersytetach w programach studiów historycznych nowych przedmiotów, które kształciłyby historyków w zakresie historii cyfrowej/wizualnej w tworzeniu transmedialnych opowieści historycznych, digital storytelling, realizacji filmów badawczych, naukowych i edukacyjnych.
Powszechna dostępność cyfrowej audiowizualności spowodowała, że w Internecie mamy do czynienia z zalewem różnego rodzaju historycznych treści, tworzonych przede wszystkim przez nieprofesjonalnych historyków[10]. Co istotne, twórcy z YouTube’a bardzo się sprofesjonalizowali pod względem umiejętności produkcji filmów. Różnej jakości treści historyczne prezentowane są w atrakcyjnej i często przekonującej filmowej formie (np. naśladującej konwencję klasycznych filmów dokumentalnych), z użyciem archiwalnych materiałów wizualnych i audiowizualnych, źródeł pisanych, drukowanych oraz z zastosowaniem efektów wizualnych, na których użycie pozwalają współczesne aplikacje do nieliniowej edycji wideo. Można się domyślać, że niedługo youtuberzy do swoich historycznych produkcji na dużą skalę zaczną angażować Sztuczną Inteligencję (AI).
***
W tym miejscu przechodzimy do wątku, jakim są możliwości AI w tworzeniu historycznych treści. O tym, że AI w postaci ChatGPT jest w stanie pisać naukowe teksty, a badacze często w nie do końca uczciwy sposób wykorzystują ją w swoich pracach, publikowano już krytyczne opracowania.
W przypadku cyfrowej audiowizualności szczególną rolę odgrywa technologia AI DeepFake, pozwalająca tworzyć wygenerowane cyfrowo filmowe obrazy wyglądające jak autentyczne na podstawie dostarczonych audiowizualnych danych (filmy, zdjęcia, dźwięki, głosy)[11].
Technologia AI DeepFake polega na algorytmach głębokiego uczenia maszynowego. Istotna jest tu technologia CNN (konwolucyjne sieci neuronowe) oraz GAN (Generative Adversarial Network / Generatywne Sieci Współzawodniczące) wykorzystująca dwie przeciwstawne sieci neuronowe określane mianem generatora i dyskryminatora. Zadaniem generatora jest tworzenie cyfrowych kopii, natomiast funkcją dyskryminatora jest porównywanie tych kopii z otrzymanymi źródłowymi danymi wizualnymi, audiowizualnymi i audialnymi. Ucząc się na podstawie porównań rysów twarzy, mimiki, gestów, głosu, generator jest w stanie tworzyć coraz dokładniejsze kopie – obrazy podobne do wprowadzonych danych źródłowych. Proces generowania trwa dotąd, aż dyskryminator przestaje odróżniać cyfrowe kopie od wprowadzonych oryginalnych materiałów źródłowych. W efekcie AI DeepFake tworzy cyfrowy model osoby (awatara) z wprowadzonych do aplikacji materiałów źródłowych, która to postać, wyglądająca jak źródłowy oryginał, może zachowywać się i mówić tak, jak zaprogramuje ją twórca/programista.
Jeszcze dwie dekady temu, aby uzyskać efekty podobne do tych, na jakie pozwala technologia AI DeepFake, tzn. tworzenia filmowych kopii / awatarów postaci (swoistych symulakrów) z ich wyglądami, głosami, mimiką, gestami, niezbędne były duże korporacje medialne, takie jak np. Discovery Channel. Kanał Discovery przywołuję tu nieprzypadkowo, to bowiem ta stacja telewizyjna dwie dekady temu wyprodukowała film dokumentalny Wirtualna historia. Tajemnice zamachu na Hitlera (2004). W dokumencie tym twarze historycznych postaci pochodzące z archiwalnych fotografii i filmowych kronik zrekonstruowano cyfrowo i nałożono na twarze aktorów. Dzięki temu zabiegowi na ekranie mogliśmy oglądać wodza III Rzeszy Adolfa Hitlera, prezydenta USA Franklina Delano Roosevelta, premiera Wielkiej Brytanii Winstona Churchilla, którzy wyglądali i brzmieli identycznie jak postacie z kronik filmowych, natomiast zachowywali się i mówili tak i to, jak i co zaplanowali twórcy filmu. Co niezwykle ważne, prace nad tym filmem, realizowanym przez wielką korporację medialną, trwały ponad trzy lata. Efekt, jaki osiągnięto, niewątpliwie był spektakularny i jeszcze współcześnie robi wrażenie.
Aktualnie technologia AI DeepFake pozwala osiągać efekty podobne do użytych w filmie Wirtualna historia. Tajemnice zamachu na Hitlera (choć oczywiście jeszcze nie w tak spektakularnej skali) z poziomu domowego komputera. Mimo że proces generowania awatarów jest skomplikowany, nie stanowi to nieprzekraczalnej bariery dla zwykłego użytkownika komputera i cyfrowych aplikacji. Oprogramowanie AI DeepFake jest ogólnie dostępne. Istnieje wiele aplikacji pozwalających tworzyć deepfake video i deepfake audio. Należą do nich np.: DeepFace Lab, Fake App, Face Swap, Murf.ai, Poza słowami, Klonowanie głosu, Play.ht, Sztuczna inteligencja Lyrebirda, Przypomina.ai, Mówca, Mów, llElevenLabs, Voice.ai-Voice changer. Za opłatą od ok. 30 $ można korzystać z ich pełnych funkcjonalności. Na tym tle wyróżnia się chińska aplikacja Zao, która oferuje spektakularne efekty w tworzeniu materiałów wideo i jest darmowa. Miejscem, gdzie można znaleźć inne aplikacje do tworzenia deepfake video/audio, jest GitHub różnego rodzaju deweloperów, którzy dysponują dostępem do oprogramowania otwartego (bezpłatnego)[12]. Aplikacje przeznaczone są na smartfony i komputery.
***
Możliwości, jakie oferuje technologia AI DeepFake, stawiają przed metodologami, historykami, historykami wizualnymi i cyfrowymi wiele nowych wyzwań i problemów natury teoretycznej, badawczej, poznawczej.
Technologia AI DeepFake z powodzeniem może być wykorzystywana przez historyków w prowadzonych przez nich badaniach przeszłości oraz do tworzenia cyfrowych narracji historycznych.
Technologia AI DeepFake może być / już jest wykorzystywana w muzeach na ekspozycjach historycznych. Pozwala generować w formie hologramu postacie historyczne (świadków historii), z którymi odwiedzający mogą rozmawiać. Przykłady takich rozwiązań można spotkać w Muzeum Holocaustu w Skokie, w Muzeum Techniki w Berlinie. Zastosowana tam technologia umożliwia odbiorcy wejście w zupełnie nowy wymiar doświadczenia audio-soma-wizualnego. Pozwala widzowi m.in. na współudział w tworzeniu narracji razem z hologramem, przyjmującej kształt dialogicznej i nielinearnej opowieści o przeszłości[13].
Technologia AI Deepfake może być wykorzystywana do generowania wiarygodnych wizualizacji historycznych postaci, które nie zachowały się na zdjęciach ani w filmach, ale ich podobizny przetrwały np. dzięki rzeźbom. Zrobienie cyfrowych zdjęć i sfilmowanie cyfrową kamerą danego monumentu pozwoli na użycie AI DeepFake i np. ożywienie postaci ze starożytności. Taka postać nie tylko będzie mogła się poruszać na ekranie, ale także opowiadać np. o swoim życiu. Może być to interesująca poznawczo forma eksperymentowania z generowaniem i przetwarzaniem źródeł historycznych. Może być to również współczesny nowy sposób publikowania źródeł. W epoce kultury werbalnej mieliśmy np. do czynienia z publikacją rękopiśmiennych tekstów źródłowych w formie drukowanego w czasopiśmie czy książce, opracowanego krytycznie tekstu, a więc swoistym przetworzeniem materiału źródłowego. Obecnie tego rodzaju źródła są udostępniane w Internecie w kształcie tekstu cyfrowego (wizualizacji oryginału, transkrypcji, transliteracji, tłumaczenia)[14]. Mając do dyspozycji technologię AI DeepFake, nic nie stoi na przeszkodzie, by przetwarzać pisane źródła w audiowizualną formę mówiących z ekranu awatarów postaci historycznych obsadzanych w roli świadków historii, pozwalających na całkowicie inną interakcję ze źródłem oraz odmienne doświadczanie przekazu źródłowego i jego treści.
Technologia AI DeepFake może pomóc w poprawianiu jakości obrazów i dźwięków zachowanych z przeszłości audiowizualnych i wizualnych materiałów źródłowych. Technologia AI Deepfake poprzez klonowanie wyglądów oraz głosu może posłużyć do rekonstruowania źródeł w postaci nagrań audio i wideo, które zostały utracone lub zniszczone. Aplikacja taka jak np. Resemble.AI czy llElevenLabs, może zostać wytrenowana na podstawie zachowanych i wprowadzonych do niej próbek głosu postaci historycznej, po czym będzie w stanie odczytać treść wpisaną do programu w formie tekstu głosem danej postaci z jej akcentem i intonacją.
Technologia AI DeepFake pozwoli tworzyć filmy historyczne z udziałem postaci historycznych wygenerowanych cyfrowo. Historyk chcący wykorzystać w swojej narracji fragmenty wspomnień świadków wydarzeń zachowanych w formie pisanego tekstu nie będzie skazany na umieszczanie na ekranie planszy z tekstem bądź odczytywanie tekstu z pomocą głosu lektora spoza kadru. Jeśli badacz będzie dysponował zdjęciem świadka i próbką jego głosu, wówczas otworzy się przed nim możliwość wygenerowania cyfrowego awatara świadka historii, który pojawi się na ekranie i opowie o swoich doświadczeniach słowami pochodzącymi ze spisanych wcześniej wspomnień. Podobnie historyk tworzący naukowy film i chcący zacytować w nim innego historyka, nie będzie musiał zapraszać danego badacza do bezpośredniego udziału w filmowym projekcie. Mając jego zdjęcie i próbkę głosu, historyk tworzący film badawczy może wygenerować awatary historyków ekspertów, którzy przemówią z ekranu swoim głosem fragmentami tekstów pochodzących z ich naukowych rozpraw.
Dobrymi egzemplifikacjami generowania za pomocą technologii AI DeepFake trudnych do odróżnienia od oryginałów cyfrowych awatarów znanych postaci są dostępne na platformie YouTube materiały wideo przedstawiające amerykańskiego prezydenta Joe Bidena, dziennikarza CNN Andersona Coopera oraz aktora Morgana Freemana[15].
W każdym z tych przykładów pojawiająca się na ekranie cyfrowa postać umieszczona obok oryginału wygląda, mówi, zachowuje się jak jej autentyczny pierwowzór. Przy czym każdy z awatarów mówi to, na co pozwolił mu programista. Dokładnie takiego rodzaju materiały wideo mogą być wytwarzane i wykorzystywane przez historyków w ich projektach.
Jak widać na przywołanych wyżej kilku przykładach, technologia AI DeepFake otwiera przed historykami całkowicie nowe możliwości w zakresie prowadzenia badań przeszłości, refleksji nad przeszłością i historią, przedstawiania przeszłości oraz wiedzy historycznej w postaci transmedialnych interaktywnych cyfrowych opowieści historycznych. Rozwój cyfrowych technologii (w tym takich jak AI DeepFake) oznacza, że historycy chcący realizować multimedialne projekty historyczne, badawcze, naukowe, edukacyjne, popularnonaukowe nie będą skazani na współpracę z medialnymi korporacjami – filmowymi studiami czy stacjami telewizyjnymi. W tym miejscu warto również zwrócić uwagę na technologię Chat GPT4 umożliwiającą tworzenie wszelkiego rodzaju grafik i wizualizacji na podstawie opisów, co także pozwala historykom na uniezależnienie się od studiów oferujących usługi w zakresie grafiki cyfrowej. Badacze, nabywając odpowiednich kompetencji w obszarze metodologii i metodyki historii cyfrowej i wizualnej, będą w stanie kreatywnie używać technologii AI DeepFake, AI ChatGPT4 oraz innych cyfrowych narzędzi i wprowadzać w życie swoje pomysły samodzielnie w ramach akademickich zespołów w cyfrowych laboratoriach i pracowniach na uniwersytetach.
Obok wielu trudnych do przecenienia korzyści w obszarze badań i przedstawiania przeszłości technologia AI DeepFake przynosi wiele problemów i zagrożeń.
Aplikacje AI DeepFake już są wykorzystywane do tworzenia np. wystąpień i wypowiedzi polityków czy ludzi show-biznesu, które nigdy nie miały miejsca. Za dobry przykład takiego właśnie jej wykorzystania może posłużyć materiał przedstawiający Baracka Obamę przekazującego ostrzeżenie przed możliwością „fałszowania wypowiedzi osób publicznych przez wrogów, którzy mogą manipulować treścią”[16].
Słów tych były prezydent USA nigdy nie wypowiedział, za to zrobił to za niego jego awatar zaprogramowany przez twórców wideo. Innym przykładem może być wideo zrealizowane przez Grega Shapiro, w którym Donald Trump wygłasza mowę o rezygnacji, przy czym jest to przemówienie wygłoszone kilkadziesiąt lat wcześniej przez Richarda Nixona[17].
Dodatkowo Trump w tym wideo przeprasza za różne swoje przewinienia. Oczywiście Donald Trump nigdy powyższych słów nie wypowiedział. Tak jak w przypadku Obamy, zrobił to za niego jego cyfrowy awatar. Powyższe egzemplifikacje pokazują, że tego rodzaju odpowiednio spreparowane materiały mogą mieć udział w kreowaniu polityki, mogą wpływać na opinię publiczną, np. przy podejmowaniu decyzji podczas wyborów, mogą także oddziaływać na decyzje i zachowania innych polityków.
Technologia AI DeepFake może być także wykorzystywana do tworzenia kompromatów osób publicznych w postaci wideo, w których twarze polityków, aktorów czy celebrytów mogą być nakładane na twarze innych ludzi. Spektakularnym przykładem takich praktyk jest wideo przedstawiające aktorkę Scarlett Johansson jako modelkę występującą w filmie porno. Twarz Johansson wypreparowana z dostępnych w sieci zdjęć została nałożona na twarz kobiety faktycznie występującej w filmie pornograficznym[18]. Innym przykładem może być przypadek polityczki, spikerki Izby Reprezentantów Nancy Pelosi. Wideo z jej udziałem zostało przerobione w taki sposób, że kobieta wygląda na nim, zachowuje się i mówi, jakby była odurzona[19].
Nie jest wykluczone, że tego rodzaju podobne problemy mogą pojawić się w środowisku naukowym, np. podszywanie się pod jakichś naukowców, pokazywanie ich jako osoby mówiące rzeczy sprzeczne z ustaleniami nauki, choćby wygłaszającymi treści np. antysemickie, albo zaprzeczającymi Holocaustowi, celem nieuczciwego eliminowania konkurencji, bądź kreowania określonej wersji polityki historycznej z udziałem cyfrowych awatarów wybranych badaczy przeszłości uchodzących w swoich środowiskach za autorytety.
Technologia AI DeepFake może być również użyta do fałszowania wyników badań poprzez kreowanie fejkowych materiałów audiowizualnych, które historycy uznają za autentyczne oraz wiarygodne źródła i wykorzystają w swoich opracowaniach. Takie materiały mogą być również skutecznie wykorzystywane do kreowania niezgodnych z ustaleniami nauki, ale niezwykle przekonujących wizji historii.
Generowane przez technologię AI DeepFake cyfrowe przekazy audiowizualne, które są trudno odróżnialne od autentycznych materiałów wideo, podobnie do innych wytworów kultury, staną się źródłami historycznymi pierwszego i drugiego stopnia. Problemy przynoszone przez cyfrowe technologie wydają się znacznie bardziej skomplikowane od tych, z jakimi historycy borykali się w przypadku tradycyjnych filmów i technologii ich wytwarzania. Technologia AI DeepFake niejako na nowo stawia przed historykami i metodologami wyzwania w postaci badawczego i poznawczego radzenia sobie z takimi cyfrowymi materiałami.
W tym miejscu należy postawić pytanie, jak historycy mogą poznawczo radzić sobie z materiałami wideo generowanymi za pomocą technologii AI DeepFake? Jak przeprowadzać krytykę zewnętrzną i wewnętrzną takiego źródła? Czy tradycyjny warsztat badawczy historyka nie wydaje się w tej sytuacji niewystarczający? Czy historycy pozostają zatem bezbronni wobec cyfrowej audiowizualności i wytworów technologii AI DeepFake? Postawione pytania jawią się jako istotne, szczególnie że algorytmy AI DeepFake są cały czas rozwijane i ulepszane, co skutkuje tym, że wideo generowane za pomocą tej techniki także jest coraz doskonalsze i tym samym staje się trudniejsze do weryfikacji.
Tradycyjny warsztat historyka nie jest całkowicie bezużyteczny w zmaganiach z wyzwaniami AI DeepFake. Oczywiście pod warunkiem, że zostanie on dostosowany do nowej sytuacji. Historyk może podjąć poszukiwania informacji identyfikacyjnych zwartych w pliku filmu – metadanych powiązanych z obrazem lub filmem pozostawionych przez programistę. Wzorem tradycyjnej krytyki badacz może skupić się na tzw. analizie niezgodności. Poddając wideo krytycznej analizie, koncentruje się na odnalezieniu niezgodności w obrazie, dźwięku, ruchach postaci, nierówności oświetlenia, dziwnych układów cieni, nienaturalnych odbić światła, które mogą zdradzać, że materiał, z którym ma do czynienia, został wygenerowany cyfrowo przez aplikację i jest fałszywką. Historyk może skupiać się na analizie wideo pod kątem poszukiwania błędów technicznych. W cyfrowych materiałach wideo generowanych przez aplikacje AI DeepFake zdarzają się różnego rodzaju nieprawidłowości. Często takie wideo charakteryzuje się obniżoną jakością (obniżoną rozdzielczością) w porównaniu z oryginałem, może w nim występować utrata detali, rozmycie tła i postaci, zniekształcenia dźwięku, gubienie głębi ostrości, niedopasowanie kolorów, rozmycie krawędzi. Wyróżnione elementy mogą wskazywać na to, że dany materiał nie jest autentyczny i może być niewiarygodny. Kolejną tradycyjną procedurą, która może się sprawdzić w krytycznej analizie, jest sprawdzenie kontekstu. Historyk może próbować badać, czy dane wideo jest prezentowane w swoim oryginalnym kontekście, czy może jest od niego oderwane i umieszczone w innym. Wówczas badacz może wdrożyć procedurę weryfikowania autentyczności analizowanego wideo w oparciu o porównwania z innymi źródłami. Inną kwestą jest to, w jakim stopniu w świecie płynnej cyfrowej audiowizualności ustalenie „oryginalnego kontekstu” będzie możliwe. Tak czy inaczej klasyczny warsztat badawczy historyka w połączeniu z kompetencjami filmoznawczymi i medioznawczymi może okazać się efektywny w krytyce i analizie cyfrowego wideo. Niemniej należy pamiętać o uwadze sformułowanej wcześniej, że algorytmy AI DeepFake cały czas są udoskonalane. Tym samym nie jest trudno sobie wyobrazić, że problemy występujące w cyfrowych materiałach wideo opisane wyżej wraz z rozwojem technologii znikną i tradycyjny warsztat badawczy historyka okaże się niewystarczający bądź w wielu przypadkach bezużyteczny. Nie oznacza to jednak, że historyk pozostanie całkowicie bezbronny w konfrontacji z wytworami AI DeepFake.
Na problemy generowane przez technologię AI z pomocą przychodzi inna technologia AI. Narzędzia do identyfikacji wideo generowanego przez AI DeepFake konstruują korporacje takie jak Facebook, Google, Adobe, Intel. Szczególnie interesująco na tym polu przedstawia się propozycja Intel Labs, który stworzył narzędzie nazywane FakeCatcher[20]. Działanie tego narzędzia także polega na głębokim uczeniu maszynowym. Aplikacja analizuje obraz pod kątem subtelnych zmian w kolorze twarzy powodowanych przez krew przepływającą przez naczynia położone blisko powierzchni skóry. Wykorzystuje używaną w medycynie metodę nazywaną fotopletyzmografią, stosowaną do diagnostyki zaburzeń w obrębie układu naczyniowego. FakeCatcher poddaje analizie przepływ krwi w pikselach obrazu, która w zależności od stopnia nasycenia tlenem zmienia odcień barwy skóry. Dla oka ludzkiego zmiany te nie są widoczne, ale potrafi wychwycić je algorytm FakeCatcher, który analizuje sygnały pochodzące z wielu klatek filmu i tłumaczy je na mapy czasoprzestrzenne. Rozpoznaje, w których miejscach i w jakim czasie zachodzą zmiany w przepływie krwi i na tej podstawie identyfikuje dane wideo jako autentyczne albo jako deepfake. Mówiąc w pewnym uproszczeniu, FakeCatcher nie koncentruje się na wyszukiwaniu w materiale wideo śladów cyfrowej manipulacji, przeciwnie – skupia się na badaniu tego, co autentyczne, ludzkie, biologiczne, a więc tego, czego technologia AI DeepFake jeszcze nie dopracowała. Dzięki temu identyfikacja autentyczności wideo przy użyciu tego narzędzia i tej metody jest możliwa i pozostanie skuteczna do momentu, w którym algorytmy AI DeepFake poradzą sobie z cyfrowym symulowaniem zjawiska przepływu krwi przez naczynia pod powierzchnią ludzkiej skóry.
Scharakteryzowane wyżej narzędzie z powodzeniem może być wykorzystywane przez historyków do weryfikacji i krytycznej analizy cyfrowych materiałów wideo.
Od poziomu kompetencji historyków w obszarze metodologii historii cyfrowej będzie zależało to, w jakim stopniu efektywnie będą oni w stanie poznawczo radzić sobie z wyzwaniami kultury cyfrowej.
[1] Zob. np. A. Bazin, Film i rzeczywistość, tłum. B. Michałek, Warszawa 1963, s. 211.
[2] B. Matuszewski, Nowe źródło historii. Ożywiona fotografia: czym jest, czym być powinna, tłum. R. Drzewiecki, Warszawa 1995, s. 161.
[3] L. Micciche, Film i historia, „Kino” 1981, nr 7, s. 26.
[4] Zob. na ten temat: P. Witek, Kultura. Film. Historia. Metodologiczne problemy doświadczenia audiowizualnego, Lublin 1995; D. Skotarczak, Historia wizualna, Poznań 2012.
[5] J.F. Lewandowski, Historyk w cieniu wytwórni, „Film” 1980, nr 8, s. 16.
[6] R.A. Rosenstone, Visions of the Past. The Challenge of Film to Our Idea of History, Cambridge, MA–London 1995; P. Witek, Kultura. Film. Historia…; D. Skotarczak, Historia, op. cit.
[7] Na temat sprawczości obrazów zob. W.J.T. Mitchell, Czego chcą obrazy? Pragnienia przedstawień, życie i miłości obrazów, tłum. Ł. Zaremba, Warszawa 2015.
[8] Na temat strategii uhistoryczniania narracji filmowej i świata przedstawionego zob. P. Witek, Strategies of Historicization of the Presented Cinematic World and Film Narrative in Historical Cinema. An Analysis of the Phenomenon on Selected Examples, „Res Historica” 2020, t. 50, s. 573–604.
[9] W Polsce ghostwriting jest nielegalny, stanowi przestępstwo. „[…] ghostwriterzy oraz ich zleceniodawcy mogą zostać pociągnięci do odpowiedzialności karnej pod zarzutem plagiatu. Jeśli zaś ghostwriting dotyczył pisania prac dyplomowych, osoba, która się tak zdobytym dyplomem posługuje, popełnia przestępstwo posługiwania się fałszywym dokumentem i poświadczania nieprawdy (art. 273 i 272 kodeksu karnego). Może to doprowadzić do unieważnienia dyplomu. Dodatkowo, jeśli to nauczyciel akademicki pracuje jako ghostwriter lub korzysta z takiej usługi, może odpowiadać dyscyplinarnie za złamanie etyki zawodu nauczyciela”. Vide: https://skupksiazek. pl/blog/zawod-ghostwriter-kto-to-jest-autor-widmo/ [dostęp: 12 X 2023].
[10] Coraz częściej w Internecie spotkać można produkcje zawodowych historyków. Niestety w większości przypadków są to tradycyjne wykłady na wybrany temat realizowane w formule „gadającej głowy”. Historyk siada przed kamerą i snuje swoją mniej lub bardziej interesującą opowieść. Spektakularnym przykładem takiej aktywności jest kanał na YouTube: Dudek o historii, w którym Antoni Dudek dzieli się z widzami swoją wiedzą, opowiadając o tym, co kiedyś wyczytał ze źródeł. Mamy tu do czynienia z zaimplementowaniem do YT tradycyjnego wykładu z klasycznej, nieskomplikowanej, zdarzeniowej i politycznej historii, zazwyczaj wygłaszanego w uniwersyteckiej auli, tudzież w sali szkolnej.
[11] Zob. I. Dąbrowska, Deepfake – nowy wymiar internetowej manipulacji, „Zarządzanie Mediami” 2020, t. 8, nr 2, s. 89–101; O. Wasiuta, Deepfake jako skomplikowana i głęboko fałszywa rzeczywistość, „Annales Universitatis Paedagogicae Cracoviensis. Studia de Securitate” 2019, nr 9 (3), s. 20–30.
[12] Zob. Repository | GitHub https://github.com/search?q=deepfake&type=repositories [dostęp: 20 IX 2023].
[13] Zob. na ten temat: S. Papier, „Hologram” ocalałego. Rozpoznanie, „Widok. Teorie i Praktyki Kultury Wizualnej” 2022, nr 33, https://www.pismowidok.org/pl/archiwum/2022/33-nowe-narracje-wizualne/hologram-ocalalego.- -rozpoznanie [dostęp: 20 IX 2023].
[14] Zob. np. Przywilej lokacyjny miasta Lublina z 15 sierpnia 1317 roku: https://teatrnn.pl/lublin-w-dokumencie/ przywilej-lokacyjny-miasta-lublina-z-15-sierpnia-1317-roku/] [dostęp: 20 IX 2023].
[15] Joe Biden: https://www.youtube.com/watch?v=LqN91DlVSS4 [dostęp: 20 IX 2023]; Anderson Cooper: https:// www.youtube.com/watch?v=3wVpVH0Wa6E [dostęp: 20 IX 2023]; Morgan Freeman: https://www.youtube. com/watch?v=F4G6GNFz0O8 [dostęp: 20 IX 2023].
[16] Zob. wideo: https://www.youtube.com/watch?v=cQ54GDm1eL0 [dostęp: 20 IX 2023].
[17] Zob. wideo: https://www.youtube.com/watch?v=NDbYhuta27I [dostęp: 20 IX 2023].
[18] D. Harwell, Scarlett Johansson on Fake AI-generated Sex Videos: ‘Nothing can stop someone from cutting and pasting my image’, “The Washington Post”, 31.12.2018, https://www.washingtonpost.com/technology/2018/12/31/ scarlett-johansson-fake-ai-generated-sex-videos-nothing-can-stop-someone-cutting-pasting-my-image/ [dostęp: 20 IX 2023].
[19] https://www.youtube.com/watch?v=sDOo5nDJwgA [dostęp: 20 IX 2023].
[20] https://www.intel.com/content/www/us/en/newsroom/news/intel-introduces-real-time-deepfake-detector. html [dostęp: 20 IX 23].







