Z danych dobry użytek
fot. K. Szewczyk / CC BY 4.0, Medialab Katowice

18 minut czytania

/ Media

Z danych dobry użytek

Aleksandra Janus

Instytucje mają dostęp do coraz większej ilości danych. Tylko jak je czytać i co z nimi począć? Medialab Katowice przygląda się kulturze (w) danych

Jeszcze 5 minut czytania

Co sprawia, że człowiek w muzeum zatrzymuje się przy tym, a nie innym eksponacie? Ile czasu tam spędza? Czym jest „zmęczenie uwagi”, którego czasem doświadcza odbiorca kultury, i jak mu zapobiegać? Te pytania brzmią niezwykle aktualnie, choć właśnie w takiej formie zadali je sobie blisko sto lat temu dwaj amerykańscy badacze, Arthur Melton i Edward S. Robinson. A po nich jeszcze wielu kolejnych. Lista z czasem znacząco się poszerzyła, włączając pytania o to, kim są odbiorcy i użytkownicy kultury, co sprawia, że się nimi stają, jakimi kryteriami kierują się, robiąc plany na wieczór lub weekend, ile są skłonni wydać na bilet, co ich zachęca, a co odstrasza, czy wreszcie – jak sprawiać, żeby wracali? Wraz z pojawieniem się nowych narzędzi niezliczeni pracownicy kultury zachodzą w głowę, jak szacować frekwencję na wydarzeniach na podstawie kliknięć na Facebooku i jaki czarodziejski algorytm decyduje o tym, kto zobaczy posta przypominającego o nadchodzącym wernisażu.

Odkąd dbanie o rozwój publiczności stało się ważnym elementem wizerunku coraz większej ilości instytucji kultury, rośnie zainteresowanie danymi, które wspierałyby strategiczne myślenie o budowaniu relacji z odbiorcami i pomagały wytyczać kierunki działania. Skąd je brać, jak je analizować i jak robić z nich (dobry) użytek? Wokół tych zagadnień toczyły się dyskusje podczas katowickiej konferencji „Kultura (w) danych”, zorganizowanej w pierwszych dniach grudnia minionego roku przez Medialab Katowice. Podobnie jak inne przedsięwzięcia Medialabu, konferencja skupiała się na tym, co dzieje się na styku różnych obszarów: projektowania, kodowania, kultury i danych.

Kultura (w) danych

Jak czytać dane i co możemy z tej lektury wynieść dla kultury, instytucji i użytkowników? Z pytaniem tym mierzyła się grudniowa konferencja i wystawa zorganizowana przez Medialab Katowice.

Wystawa otwarta jest do 15 stycznia 2018.
Katowice Miasto Ogrodów
plac Sejmu Śląskiego 2

Medialab Katowice, działający przy instytucji kultury Katowice Miasto Ogrodów, dał się poznać jako organizacja aktywnie poszukująca sposobów wykorzystania technologii i danych do badania i odkrywania miasta oraz procesów, które je kształtują. Efektem takich działań była prezentowana w 2015 roku wystawa „Apetyt na radykalną zmianę” i konferencja „Rediscovering the City”. Medialab stoi także za trzema zrealizowanymi dotąd edycjami festiwalu art+bits, gromadzącego środowisko twórców i badaczy działających na pograniczu sztuki, designu i technologii. Tym razem pretekstem dla konferencji poświęconej kulturze i danym było przeprowadzone przez organizatorów badanie katowickiej kultury, którego wyniki zaprezentowane zostały także w formie wystawy „Kultura w danych: jak wydarzenia kulturalne tworzą miasto. Interdyscyplinarne przedsięwzięcie Medialabu połączyło siły badaczy, projektantów i programistów, by mogli sprawdzić, czego o lokalnej kulturze i jej miastotwórczej roli można dowiedzieć się dzięki zastosowaniu cyfrowych narzędzi opartych na danych.

Konferencja zgromadziła badaczy, projektantów, aktywistów – w tym osoby specjalizujące się w (także tradycyjnych) badaniach kultury, projektantów oraz specjalistów od wykorzystywania cyfrowych narzędzi przetwarzania danych. Tematem dyskusji byli zarówno użytkownicy kultury, instytucje, które próbują poznać ich potrzeby, oraz metody i narzędzia, które mogą im do tego posłużyć, jak i zagadnienia wiążące się ze społeczeństwem danych. Zagadnienie życia wśród danych jest szerokim problemem otwierającym pytania o prawa dostępu do wiedzy, prywatność i transparentność procesów ich przetwarzania i władzy tych, którzy zarządzają narzędziami ich interpretacji. Temu tematowi poświęcam uwagę jako pierwszemu, gdyż stanowi kontekst dla dwóch kolejnych: potencjału danych dla badaczy, w tym badaczy kultury, oraz ich użyteczności dla instytucji.

Życie (w) danych

Wbrew nadziejom wiązanym z rozwojem kultury internetu, w sieci zdominowanej przez wielkie korporacje znacznie ważniejsze niż user-generated content okazały się user-generated data. Od inteligentnych miast, domów i przedmiotów, aż po quantified self – zsieciowany świat napędzany jest danymi. Jak twierdzą redaktorzy „Datafied society”, „rewolucję danych” (data revolution) i jej wpływ na społeczeństwo XXI wieku możemy porównać z tym, jak pojawienie się elektryczności zmieniło procesy przemysłowe i praktyki domowe w wieku XIX.

Niewątpliwie jedną z cech charakterystycznych tej zmiany jest sytuacja, w której eksploatacja naszej prywatności tworzy wartość, nad którą my sami nie mamy żadnej kontroli. W Katowicach przypominała o tym zarówno Katarzyna Szymielewicz (Fundacja Panoptykon), jak i Michiel de Lange (Uniwersytet w Utrechcie, Mobile City). Dane – wbrew temu, co mogą sugerować – nigdy nie są po prostu dane. Zwłaszcza gdy produkt lub narzędzie jest bezpłatne, w istocie płacimy za nie swoimi danymi. Wraz z tym, jak nasze życia, miasta, domy i ciała coraz silniej kształtowane są przez technologie cyfrowe, kluczowe stają się pytania o prywatność, transparentność i kontrolę. Zwłaszcza w konfrontacji z czarną skrzynką, która skutecznie skrywa algorytmy  odpowiadające za decyzje mające wpływ na nasze życia – na przykład te, które regulują działanie popularnych platform i serwisów społecznościowych. Odtworzenie prawdopodobnych sposobów ich działania jest pracochłonne i czasochłonne, ale nawet wówczas, gdy się to udaje, pozostaje wyzwanie przetłumaczenia tej wiedzy na język, który może być czytelny poza wąskim gronem ekspertów.

Próbą takiego przekładu był projekt Katarzyny Szymielewicz stworzony w oparciu o efekty pracy Share Labs – labu badawczego z Jugosławii. „Facebook Algorithmic Factory” wypływa z potrzeby zajrzenia do algorytmicznej fabryki największego serwisu społecznościowego świata, by sprawdzić, w jaki sposób Facebook przetwarza informacje o nas i jak podejmowane są decyzje, które mają wpływ na nasze życie. Share Labs opowiada o swoim projekcie językiem nierówności w dostępie i kontroli nad środkami (cyfrowej) produkcji, nowych mechanizmów wykluczenia i wyzysku, nowych form pracy i nowych naruszeń praw człowieka. Efektem przeprowadzonych analiz są wizualizacje danych w formie rozległych map odtwarzających wnętrze algorytmicznej fabryki Facebooka. Dane, którymi dysponuje serwis społecznościowy, to nie tylko to, co na zasadzie transakcji udostępniamy (na przykład imię i nazwisko, zdjęcia, treści, które publikujemy), ale także obserwacje naszego zachowania. W rezultacie wewnątrz algorytmicznej fabryki Facebooka działa potężne narzędzie predykcyjne. Wszyscy, którzy chcieliby sprawdzić to na własnej skórze, mogą dołączyć do projektu „Facebook Tracking Exposed” prowadzonego przez grupę wolontariuszy, którzy starają się zajrzeć do społecznościowej czarnej skrzynki, w zamian dając użytkownikom dostęp do analizy sposobu, w jaki algorytmy kształtują nasz własny timeline. Katarzyna Szymielewicz, we współpracy z Vladanem Jolerem z Share Labs i Pawłem Janickim z Centrum Sztuki WRO, przełożyła wykresy jugosławiańskiej grupy badawczej na opowieści o codziennym doświadczeniu użytkowników sieci, które przybrały formę instalacji interaktywnej. Dzięki niej możemy – na przykładzie konkretnych, fikcyjnych życiowych historii – zobaczyć, w jaki sposób wiedza/władza serwisu może zaważyć na naszym osobistym i zawodowym życiu.

Facebook FactoryFacebook Factory / Share Lab

Nasze cyfrowe ślady przetwarzane przez algorytmy mają ogromną wartość dla wszystkich, którym zależy na wywarciu wpływu na nasze zachowania – od zakupu nowej pary butów do decyzji wyborczych. Nie bez powodu w czasie katowickich dyskusji powracało nazwisko Michała Kosińskiego z Uniwersytetu Stanforda, które zaczęto odmieniać przez wszystkie przypadki, gdy jego metody badań i profilowania osobowości na podstawie śladów cyfrowych znalazły swoje zastosowanie w marketingu politycznym.

Co więcej, nasze wyobrażenia na temat tego, jak działają konkretne serwisy i platformy, wywierają także wpływ na sposób tworzenia treści z przeznaczeniem dla tych konkretnych platform – zarówno przez wielkich graczy rynkowych, jak i indywidualnych użytkowników czy instytucje kultury. Karin van Es, koordynatorka ośrodka badawczego Datafied Society na Uniwersytecie w Utrechcie, zwracała uwagę na potrzebę obserwowania tego, w jaki sposób ludzie żyją wśród danych oraz jak ich wyobrażenie na temat tego, co zawierają „czarne skrzynki”, zmienia ich codzienne zachowania i praktyki. Tam, gdzie brakuje nam dostępu do wiedzy, uruchamia się wyobraźnia i kształtują się sposoby myślenia o tym, czym są algorytmy i jak funkcjonują. Taina Bucher, autorka terminu algorithmic imaginary, twierdzi, że wyobraźnia wpływa nie tylko na ludzkie zachowania, ale także zwrotnie na kształtowanie się samych algorytmów i że w istocie jest to rodzaj interakcji pomiędzy algorytmami a ludzkim wyobrażeniem na temat sposobów ich działania.

Życie wśród danych zmienia nasze codzienne praktyki i stawia przed nami nowe wyzwania – zarówno dotyczące prywatności, jak i zdolności rozumienia nowych sposobów komunikowania wiedzy. Dane – wraz z narzędziami ich przetwarzania i wizualizacji – mogą wspierać działania oddolne i wspierać aktywizm społeczny, o czym opowiadała podczas konferencji Angeles Briones z Density Design Research Lab w Mediolanie. Jednocześnie, przyglądając się temu, w jaki sposób ludzie wchodzą w relacje z danymi, badacze (np. wspominana w panelu dyskusyjnym Helen Kennedy z University of Sheffield) zwracają uwagę na to, że rosnące znaczenie naszych codziennych interakcji z wizualizacjami danych wymaga rozwoju kompetencji niezbędnych do ich krytycznej lektury. Pomiędzy odbiorcą a zbiorem danych istnieje zazwyczaj potrzeba mediacji, a rolę tłumacza wypełnia zazwyczaj interdyscyplinarny zespół składający się z badaczy i projektantów. Brakującym elementem relacji pozostaje jednak niekiedy przejrzystość założeń i decyzji, które leżą u podstaw takiej, a nie innej prezentacji danych. Choć niosą one ze sobą obietnicę dostarczenia nam „obiektywnego” obrazu pewnego wycinka złożonej i dynamicznie zmieniającej się rzeczywistości, wizualizacje często nie ujawniają tego, co zachodzi w procesie ich obróbki.

Mapa i terytorium

Pojawienie się i upowszechnienie praktyk zbierania, przetwarzania i analizy dużych zbiorów danych – fenomen znany wszystkim dobrze jako Big Data – stało się charakterystyczne dla społeczeństw, w których wartość ekonomiczna generowana jest poprzez przetwarzanie informacji i monetyzację wiedzy. Zjawisko, z którym mamy do czynienia, to – jak przekonuje Karin van Es – nie tyle Big Data, co zwrot sięgający swoimi korzeniami lat pięćdziesiątych, gdy znane od wieków maszyny liczące zastąpione zostały przez pierwsze komputery elektroniczne. Potencjał wykorzystania narzędzi operujących ogromnymi zbiorami danych stanowi o ich atrakcyjności dla badaczy różnych specjalizacji, w tym badaczy kultury. Już sama wizualizacja danych może być traktowana jako narzędzie badawcze,  jeśli idzie w parze z transparentnością w kwestii wyboru punktu widzenia i jawnością założeń stojących za decyzjami będącymi podstawą wizualizacji – o czym w Katowicach opowiadał Michele Mauri z Density Design Lab.

Jednocześnie badacze podchodzą do entuzjazmu wobec Big Data z pewną rezerwą. Przywołana w katowickiej dyskusji Lindsay Caplan (Brooklyn Institute for Social Research) zwraca uwagę, że choć dane przetworzone za sprawą wizualizacji, syntetyzacji i estetyzacji niosą nadzieję na odnalezienie wzorców i reguł widocznych tylko z lotu ptaka, często to właśnie ich skala uniemożliwia formułowanie konkluzji. Przywołując Borgesowską historię o mapie będącej reprezentacją terytorium w skali 1:1 („O dokładności w nauce”, 1946), Caplan zwraca uwagę na ogrom danych, które mogą być gromadzone aż do granicy nieprzeliczalności, będąc niezupełnie mapą i nie całkiem terytorium. Archiwa i zbiory danych okazują się tak rozległe, jak zjawiska, które starają się przedstawić i zdefiniować. Big Data mogą dawać złudzenie oferowania pełnego obrazu w pełnej rozdzielczości, który nie potrzebuje żadnej teorii, modeli ani hipotez, który przemawia sam za siebie, wolny od stronniczości i subiektywności, którego znaczenie wykracza poza kontekst lub konkretną dziedzinę wiedzy. Tego rodzaju przekonania Rob Kitchin zalicza do najważniejszych błędów w podejściu do Big Data.

Kultura w danych. Jak wydarzenia kulturalne tworzą miasto. Dokumentacja wystawy fot. K. Szewczyk CC BY 4.0 Medialab KatowiceWidok wystawy „Kultura w danych. Jak wydarzenia kulturalne tworzą miasto” / fot. K. Szewczyk, CC BY 4.0, Medialab Katowice

Medialab Katowice – zarówno we własnym przedsięwzięciu badawczym, jak i konstruując program konferencji – postawił szereg pytań o potencjał metod analitycznych wykorzystujących dane (stosowanych np. w marketingu lub biznesie) dla badań kultury. Jak wykorzystać media społecznościowe w badaniach wydarzeń? Czy media społecznościowe oraz metody analizy dużych zbiorów danych umożliwią lepsze poznanie złożonego ekosystemu kultury w mieście? Jaka jest jakość tych danych? W jaki sposób łączyć te metody z tradycyjnym podejściem nauk humanistycznych i społecznych?

Aby to sprawdzić na własne potrzeby, interdyscyplinarny zespół powołany do pracy przy projekcie eksperymentował z łączeniem różnych metod. Między innymi stworzył aplikację – wraz z krótką ankietą – wykorzystującą dane z Facebooka do badania uczestnictwa w wydarzeniach kulturalnych na terenie Katowic. Celem było sprawdzenie, czy osoby deklarujące zainteresowanie wydarzeniami kulturalnymi na Facebooku rzeczywiście biorą w nich udział. Ankieta dotyczyła wydarzeń, w których badany faktycznie uczestniczył, w tym zwłaszcza sposobu dotarcia do danego miejsca, towarzystwa czy poniesionych w związku z wyjściem wydatków. Ponadto pokazał, w jaki sposób z pomocą Google Distance Matrix API sprawdzić dostępność komunikacyjną instytucji. Na blogu badawczym Medialabu znaleźć można nie tylko podsumowanie najważniejszych wniosków z badań, ale też rozmowy z zaangażowanymi w proces ekspertami. Być może praktyka ta przetrze szlaki dla instytucji, które mają ambicję, by korzystać z nowych metod i narzędzi pozwalających na gromadzenie i wykorzystywanie wiedzy na temat swoich użytkowników.

Data-driven institution?

Podczas katowickiej konferencji rozmawiano także o nowych badaniach kultury wykorzystujących bardziej tradycyjne metody. O tych przeprowadzonych w ostatnich latach opowiadali Bogna Świątkowska, Edwin Bendyk i Piotr Knaś (Małopolski Instytut Kultury). O wielu z nich mogliśmy także przeczytać w kolejnych numerach „Notesu na 6 tygodni” oraz na stronie Narodowego Centrum Kultury. Czy wzrost zainteresowania badaniami użytkowników kultury wśród instytucji, które coraz częściej same zamawiają i realizują badania, to jaskółki zapowiadające, że wkraczamy w erę data-driven institution?

Instytucje mają dostęp do coraz większej ilości danych. Nie tylko za sprawą prowadzonych przez nie same badań  i dostępnych szeroko wyników tych prowadzonych przez innych, ale także za sprawą narzędzi pozwalających gromadzić i analizować informacje na temat własnej publiczności online i offline. Ta niewątpliwie korzystna sytuacja niesie ze sobą przynajmniej dwa ważne wyzwania – jedno dotyczy zdolności instytucji do przetwarzania i wykorzystywania tych danych, drugie – obowiązującego systemu sprawozdawczości, który wpływa na sposób ich pracy z danymi i jakość statystyki publicznej.

Z tym drugim zagadnieniem zmierzył się zespół Małopolskiego Instytutu Kultury, czego efektem jest raport „Nowa sprawozdawczość instytucji kultury”. Jak słusznie zauważają jego autorzy, obraz statystyczny społeczeństwa i jego instytucji zależy od kształtu narzędzi statystycznych i procedur ich użycia, a przekłada się na diagnozy, które wpływają na decyzje o inwestycjach publicznych. Istotne jest nie tylko, aby narzędzia i procedury działały sprawnie, ale także – aby dane zgromadzone z jego użyciem były adekwatne do zmieniającej się rzeczywistości i potrzeb informacyjnych. W oparciu o analizę sprawozdawczości GUS-owskiej, dyskusje eksperckie i pilotaż eksperymentalnego systemu sprawozdawczego zespół zaproponował nowe rozwiązania i rekomendacje dla statystyki publicznej.

Wobec dostępu do rosnących zasobów danych instytucje stają wobec konieczności znalezienia sposobów pracy z nimi. W praktyce, aby móc je efektywnie analizować i przetwarzać, konieczny jest czas i możliwość współpracy z osobami o zróżnicowanych kompetencjach. Aby było to możliwe, w wielu instytucjach musiałoby dojść do zmiany sposobu zarządzania wiedzą, a prawdopodobnie także zmiany sposobu zarządzania w ogóle. To, że dane nigdy nie są tak po prostu dane, oznacza także, że aby zrobić z nich użytek, musimy umieć zadać im właściwe pytania, a następnie przetwarzać je, analizować i interpretować, aby uzyskać odpowiedzi. A żeby wiedza mogła cyrkulować w instytucji, konieczne jest także komunikowanie ich w sposób przystępny i zrozumiały dla wszystkich. W praktyce może to oznaczać konieczność wypracowania systemu, w którym – tam, gdzie to możliwe – instytucja staje się bardziej zwinna, umożliwiając sobie odpowiadanie na wnioski i obserwacje płynące z badań i danych. Takie postawienie sprawy łatwo zbyć można jako pobożne życzenie, jednak – w świecie, w którym konkurencją dla muzeum jest raczej Netflix niż inna instytucja kultury – wydaje się to niezbędne dla myślenia o roli i przyszłości kultury instytucjonalnej. Pytanie nie brzmi: „czy”, ale „jak” czerpać z dostępnych danych oraz nowych narzędzi i metod ich przetwarzania, nie tylko unikając wspomnianych pułapek, ale przede wszystkim – tworząc środowisko pracy dla interdycyplinarnych zespołów zdolnych zamieniać dane w materiał użyteczny dla pracowników i współpracowników, a ostatecznie – i samych odbiorców instytucji.

Tekst dostępny na licencji Creative Commons BY-NC-ND 3.0 PL (Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych).