W obronie danych: Niehumanistyka cyfrowa?
NYCDoITT

10 minut czytania

/ Media

W obronie danych: Niehumanistyka cyfrowa?

Scott Selisker

Hiperboliczne porównanie algorytmów z faszyzmem każe sądzić, że esej Marche’a to przykład aż nazbyt powszechnego katastroficznego podejścia do technologii

Jeszcze 3 minuty czytania

Opublikowany na łamach „Los Angeles Review of Books” esej Stephena Marche’a „Literatura to nie dane: przeciw cyfrowej humanistyce” wywołał wiele negatywnych reakcji. W komentarzach pod tekstem oraz w licznych dyskusjach na Twitterze słychać było donośne głosy o „tworzeniu chochołów”, zbyt potulnej postawie cyfrowych humanistów, niezrozumiałej nostalgii autora, pojawiły się również próby definiowania, czym tak właściwie są „dane” (najlepiej ujmuje to badaczka literatury Natalia Cecire, odnosząc się do tytułu tekstu Marche’a: „Właściwie niczego nie można nazwać «danymi». «Dane» to abstrakcja umożliwiająca prowadzenie niektórych dociekań”). Uznając cyfrową humanistykę jednocześnie za wydmuszkę („chochoła”) i wynaturzenie, Marche zaledwie sygnalizuje, czym tak właściwie jest ten nurt badawczy.

Tematem przewodnim jego tekstu są próby digitalizacji milionów książek przez Google, powszechna dostępność do światowych archiwów literackich i wspomagana maszynowo analiza danych literackich („czytanie z oddali”) – algorytmiczne i „nieludzkie” podejście do badania tekstów. Analiza ilościowa jest jego zdaniem skazana „na uproszczenia”, a „Do latarni morskiej” Wirginii Woolf rozważane jedynie jako zbiór danych „staje się kolejną powieścią w nieprzebranym ich stosie [bazie danych]”. Brzmi to tak, jakby któregoś dnia badacze literatury mieli nakarmić maszynę wszystkimi tekstami Wirginii Woolf i zapomnieć, że to dobre książki (bez obaw, nie ma takiego zagrożenia). Marche boi się, że wraz z nastaniem cyfrowej humanistyki naukowcy, a być może nawet i czytelnicy, zapomną o „ludzkim pierwiastku” literatury. Zagrożenie cyfryzacją zmusza go do stworzenia katalogu „ludzkich” pierwiastków literatury: chaotyczność, fragmentaryczność, niemożliwość sprowadzenia do postaci zbioru danych; twierdzi również, że maszyny nie są w stanie pojąć znaczenia literatury.

Hiperboliczne porównanie algorytmów z faszyzmem każe sądzić, że esej Marche’a to przykład aż nazbyt powszechnego katastroficznego podejścia do technologii. Pisząc o „ludzkim pierwiastku” literatury, równie dobrze mógłby pisać o ludzkości jako takiej: jej „chaotyczności”, potrzebie kontaktu i poszukiwania znaczeń. Siłą napędową jego eseju jest znajomy, na wpół świadomy lęk przed maszynami, które zagrażają wszystkiemu, co tak mocno cenimy – od przyjemności czytania po nasze oszczędności. Przypisując algorytmom swego rodzaju faszystowską naturę, Marche wtóruje takim dystopijnym klasykom jak George Orwell czy Anthony Burgess, którzy widzieli w technologii narzędzie totalitarnego ucisku, przeciwieństwo tego, co ludzkie, humanistyczne i demokratyczne. Tylko w takim sensie możemy uznać jego sugestię, jakoby algorytmy „traktowały literaturę jako jednorodną masę” za tragiczną, nawet jeśli trwa to zaledwie przez kilka cykli pracy procesora. W tym samym tekście znajdziemy jednak również wzmiankę o „utopijnym” i przesiąkniętym „demokratycznym duchem” projekcie Google Books, udostępniającym cyfrowe wersje książek. Być może nieświadomie, esej Marche’a stanowi doskonały przykład utopijno-dystopijnej mieszanki sposobów myślenia współczesnej kultury o nowych technologiach.

Można by się spodziewać, że skupiając się na destrukcyjnym wpływie cyfrowej humanistyki na wszystko, co święte, Marche uważnie przyjrzał się badaniom z tego zakresu. Problem w tym, że jedynym przytoczonym przez niego przykładem jest praca stworzona przez analityków, a nie literaturoznawców – „Wzory ilościowe wpływów stylistycznych w ewolucji literatury”.

Marche opisuje i wyszydza cyfrową humanistykę, nazywając ją „kolejnym wielkim przełomem”. Pochopne jest jednak myślenie, że odmieni ona radykalnie system wartości czy cele badań literackich. Póki co największy wpływ cyfrowych technologii możemy zaobserwować (i obserwujemy) w metodach publikacji prac naukowych. Dostęp do przydatnych treści jeszcze nigdy nie był tak łatwy, zarówno za pomocą multimedialnych archiwów, jak i stron internetowych, które łączą podejście naukowe z popularyzacją wiedzy, dzięki czemu każdy zagorzały czytelnik może być na bieżąco ze światem literackim. Niszowe metodologie, takie jak czytanie z oddali czy ekstrakcja danych, również wywierają wpływ na nasze rozumienie kultury w erze cyfrowej.

Reakcje

Opublikowany na łamach „Los Angeles Review of Books” esej Stephena Marche’a „Literatura to nie dane: przeciw cyfrowej humanistyce” wywołał burzliwą dyskusję w Stanach Zjednoczonych i liczne reakcje, wiele z nich krytycznych. Publikujemy dwie z nich: autorstwa Scotta Seliskera literaturoznawcy z Uniwersytetu Arizony oraz Holgera Schotta Syme'a historyka teatru i literatury z Uniwersytetu Toronto.

Przedstawiciele cyfrowej humanistyki, o których wspomina Marche, pracują na olbrzymich zbiorach danych, a ich działalność przynosi wiele nowych pytań na temat naszego językowego, literackiego i kulturalnego dziedzictwa. Możemy być pewni, że nie zajmują się tym, „jakie jest znaczenie literatury”, nie próbują również wyjaśniać, „o czym mówi «Epos o Gilgameszu»” – przede wszystkim dlatego, że do odpowiedzi na te pytania nie potrzebujemy komputerów. W znanej książce Douglasa Adamsa „Autostopem przez Galaktykę” opisano stworzenie komputera, zdolnego odpowiedzieć na pytanie „o życie, wszechświat i całą resztę”, ale przedstawiciele cyfrowej humanistyki zadają swoim maszynom o wiele precyzyjniejsze pytania. Nie można traktować tych działań jako sygnałów nadchodzącej zagłady ani jako oznak tryumfu. Nie zagrażają one unikalności tekstów literackich, tylko dostarczają nam kolejnych użytecznych informacji na ich temat.

Spójrzmy na kilka przykładów pochodzących z publikacji z zakresu cyfrowej humanistyki:

  1. W jaki sposób zmienia się słownictwo poetów (zwłaszcza tych posługujących się wyszukanym, „literackim” słownictwem).
  2. Dlaczego tytuły osiemnastowiecznych powieści są dłuższe niż tych, które powstały wiek później? Czy badanie coraz krótszych tytułów może powiedzieć nam coś nowego o wpływie wydarzeń historycznych, technologii i rynku na tę zmianę?
  3. W jaki sposób chronologia przedruków pewnego opowiadania w dziewiętnastowiecznej prasie anglojęzycznej pozwala nam zrozumieć system rozpowszechniania informacji, który obowiązywał w wieku pary?
  4. W jaki sposób opublikowane na początku wieku katalogi słów, używanych przez takich twórców jak Chaucer i Szekspir, wpłynęły na ilość prac badawczych poświęconych tym autorom? (ku zaskoczeniu badaczy, okazało się, że w ogóle nie miały wpływu).

To jedynie kila przykładów „czytania z dystansu”, o którym wspomina Marche. Mam nadzieję, że pomogą one rozwiać wszelkie przypuszczenia, jakoby kodowanie miało zastąpić badania literackie, a zawiłości tekstu zostaną sprowadzone do postaci równań. Są to przykłady nowego, kreatywnego myślenia o problemach historyczno-literackich, możliwego właśnie dzięki komputerom. Sam Marche zauważa, że pod obszernym namiotem cyfrowej humanistyki jest miejsce dla analizy informacji i jej sieci przepływów, dla nowych cyfrowych archiwów, pomagających w rozpowszechnieniu i zrozumieniu dzieł literackich, dla nowych form szkolnictwa oraz eksperymentów humanistycznych i komunikacyjnych.

Masz coś do algorytmów?Jak to bywa w nauce, część z tych badań nie przyniesie żadnych efektów, inne mogą zmienić nasze postrzeganie pewnych typów literatury lub to, jak rozumiemy jej historię. Nie należy w tym upatrywać wynaturzenia czy też faszyzmu. Żadne z tych pytań nie zagraża literaturze, nie odbiera jej wpływu na nasze myślenie. Tego rodzaju badania nie zastąpią doświadczeń studentów, pochylających się nad księgami, czytelników, skulonych na swoich kanapach, czy profesorów, pracujących w zaciszu własnych gabinetów. Wspomagane komputerowo projekty czytania z oddali to tylko uzupełnienie – na razie skromne, z czasem być może coraz większe – tego, co już wiemy o literaturze, podobnie jak dane biograficzne i historyczne, z których korzystamy od dawna. Dzięki niemu wiemy, jak wiele powieści detektywistycznych publikowano każdego roku w dziewiętnastym stuleciu i co można było kupić za pięć funtów szterlingów w Londynie z czasów Arthura Conan-Doyle’a. Tworząc zupełnie nowe metody badawcze, przedstawiciele cyfrowej humanistyki muszą się jeszcze wiele nauczyć od informatyków, geografów, statystyków i socjologów, którzy od długiego czasu opracowują systemy wizualizacji danych. Ale to właśnie umiejętność praktycznego wykorzystania nowych metodologii i nowych informacji była od zawsze jedną z najsilniejszych stron nauk humanistycznych.

Nie ma wątpliwości, że nadchodzi era maszyn, algorytmów i danych, niestety Marche ignoruje to, czego najbardziej potrzebujemy: wnikliwe, wykorzystujące nowe technologie teksty i badania, oparte na zrozumieniu ograniczeń wynikających z posługiwania się danymi i niemierzalności niektórych wartości literackich. W tym momencie większym wyzwaniem dla wyznawanych przez nas wartości są algorytmy zarządzające handlem, coraz intensywniejsza monetyzacja ludzkich działań czy też cyfryzacja wojny (drony). Zwłaszcza w Stanach Zjednoczonych poddawani jesteśmy nieustającemu bombardowaniu za pomocą informacji i obrazów, zasypuje się nas motywowowanymi politycznie wynikami badań i wypowiedziami polityków, ulegających naciskom lobbystów. Gwałtowny rozwój technologii komunikacyjnych sprawił, że mamy do czynienia nie tylko z przeładowaniem informacyjnym, ale musimy sobie radzić także ze sprzecznymi danymi, pochodzącymi z różnych źródeł. Jak mamy ocenić, które z nich jest właściwe? Co jest dla nas wartościowe i dlaczego? Szukając odpowiedzi na te pytania, zawsze będziemy się zwracać ku naukom humanistycznym lub literaturze.

Przekład MS

Cykl tekstów dotyczących kultury cyfrowej powstaje we współpracy z Centrum Kompetencji ds. Digitalizacji Narodowego Instytutu Audiowizualnego.

Artykuł pochodzi z „Los Angeles Review of Books” (wydanie z 2 listopada 2012).