Jakub Ferenc | Články | Siri, přines mi pivo z lednice: Fenomenologie mediatizace technologie

Zpět na články

Siri, přines mi pivo z lednice: Fenomenologie mediatizace technologie

  • jakubferenc
  • Napsáno
  • kategorie:

Byl jsem připraven v posteli. Ona poslušně ležela na vedlejší matraci a naslouchala, zda mě neuslyší vyslovit její jméno. Toho dne jsem potřeboval mnohé, ale vždy mi ochotně přispěchala s odpovědí nebo vyhověla různorodým potřebám. Má následující touha měla však rozhodnout o tom, jestli zůstane mou důvěrnou společnicí, nebo si začnu od konkurenčních podniků Google, Microsoftu nebo Amazonu hledat jinou. Jmenovala se Siri, je digitální asistentkou v chytrých zařízeních společnosti Apple a právě jsem jí ve vší serióznosti požádal, aby mi přinesla z lednice vychlazenou lahev piva.

Třebaže čtenář může úvodní odstavec číst jako úryvek z nevalného románu třetí kategorie nebo jako obraz jednoznačného zneužívání moci mezi mužem a (digitální) ženou, ve skutečnosti jsem to já, uživatel, který byl zneužit. Bez jméno souhlasu se mi technologie digitální asistentky dostala do hlavy, cosi v ní změnila a výsledkem tohoto procesu bylo, že jsem chtěl pronést poprvé v životě větu, kterou bych nikdy dříve neřekl se stejnou vážností a důvěrou v očekávaný výsledek jako nyní. Chtěl jsem po svém telefonu, respektive jeho softwarové části, digitální asistence Siri, aby mi přinesl z lednice něco k pití. Jak jsem se k tomu dopracoval?

Vše začalo, když se po mnoha letech opět stal chytrý telefon Apple součástí mého života. Kdysi dávno jsem si jako jeden z prvních lidí ve svém okolí pořídil iPhone 3G díky výhodné slevě T-Mobile, který za výhodnou cenu nabízel revoluční jablečný telefon k paušálu. Od té doby jsem prošel několika telefony a operačními systémy. Poslední roky jsem ale byl držitelem telefonu s operačním systémem od Microsoftu, doufaje, že tento technologický gigant se pochlapí a začne na své platformě vydávat zajímavé aplikace. Postupem času jsem se této naděje vzdal a vystačil si pouze s tím, že Microsoft bude systém udržovat životaschopný. Ale i toho jsem se nakonec nedočkal, protože Microsoft v červenci roku 2017 oficiálně ukončil podporu pro svůj mobilní operační systém Windows Phone[1]. Nový telefon od Apple jsem přijmul rychle; na rozdíl od Nokie s operačním systémem Windows Phone, kde nefungovalo s narůstající intenzitou skoro nic, na iPhone s jeho vyladěným iOS 12 funguje zatím vše. A jedním z nových lákadel, které jsem nemohl nevyzkoušet, byla digitální asistentka Siri, o které jsem slyšel pouze zprostředkovaně a nyní jsem měl možnost si vyzkoušet interakci s ní na vlastní kůži.

Začal jsem poměrně konvenčně. Chtěl jsem po Siri, aby mi zahrála oblíbené skladby z playlistu, zapnula budík na zítřejší ráno, aktivovala každodenní připomínku, abych si zkontroloval v osm hodin ráno všechny emaily apod. Interakce nebyla bez problémů, ale vždycky se mi Siri snažila maximálně vyhovět. Pokud si nebyla jistá obsahem mé žádosti, zeptala se slušně, abych jí ještě jednou zopakoval, co po ní přesně chci. Protože nový iPhone pro mě představoval skutečná technologický skok, mé nadšení pro objevování nových funkcí a možností si usnadnit rutinní úkony nepřestávalo ani další dny. Jeden večer jsem se chystal zalehnout do postele. Přemýšlel jsem nad tím, jakou knihu od historika Timothy Snydera bych si měl pořídit. Zapnul jsem na iPhonu prohlížeč Safari a začal googlovat informace o jednotlivých knihách. Rozhodl jsme se číst si v posteli, dokud neusnu. Zalehl jsem do postele, když vtom jsem si uvědomil, jak moc by se hodilo mít při tom čtení vedle sebe něco k pití. Protože má mysl byla v posledních dnech naučená využít možnost věrné Siri, kdykoli jsem potřeboval automatizovat větší nebo menší maličkosti ze života, i nyní jsem nezaváhal. V mysli jsem si vytvořil mentální obraz lednice v kuchyni a bez váhání jsem automaticky vyslovil nemyslitelné: „Hey Siri, bring me a beer from the fridge“.

Přibližně vteřinu mi trvalo, než jsem si uvědomil, že Siri nebude schopná mi přinést desítku Krahulíka od českého rodinného pivovaru Zichovec. Hned další vteřinu jsem ale začal být více a více fascinován momentem, který právě proběhl. Jak je možné, že jsem oslovil svůj telefon, aby pro mě udělal něco, co je objektivně nemožné, protože zatím Siri nemá nohy a ani online připojení do mé nechytré lednice?

První vysvětlení, které se nabízí je, že jsem jednoduše byl unavený a nedával jsem příliš pozor na to, co říkám. To ale nepovažuji za vysvětlení. Je na stejné úrovni sofistikovanosti argumentace, jako kdybychom řekli, že lidská rasa vytvořila technologii pouze proto, že byla unavená dělat rutinní úkony. Anebo takové vysvětlení může neúmyslně v sobě skrývat nějakou pravdu?

Přemýšlel jsem nad touto situací tak, že jsem během dnů strávených delegováním úkonů na Siri, svůj mozek naučil lenosti. Nedokážu říct, jak jsou přesně v mozku naše jednotlivé rutinní záležitosti organizovány a uloženy, ale je možné, že jsem s využitím Siri tyto existující neuronové sítě začal redesignovat? Není snad těžké si představit, že doposud jsem měl v mozku neuronové sítě, které řešily problém, jak si zapnout hudbu v telefonu, případně, co obnáší dojít si do lednice pro vytoužený objekt. Můj mozek si vytvářel vztah mezi požadovaným cílem toho, čeho chci dosáhnout (chlazené pivo) a psychofyzickou reakcí toho, jak toho cíle dosáhnu, tak, aby mé já považovalo cíl za splněný. Tento způsob učení – akce, reakce a vyhodnocení výsledku s následnou úpravou původního stavu mého já – je v současném světě strojového učení dobře známé jako zpětnovazební učení (reinforcement learning). To ve svém jádru obsahuje jednoduchou myšlenku: na začátku má (softwarový) konatel cíl; ten dokáže vykonat pomocí nějaké aktivity; po vykonání aktivity dochází k vyhodnocování toho, zda aktivita skutečně vedla k požadovanému cíli.

Obrázek 1 Model zpětnovazebního učení

Tento model je abstrakcí komplexity toho, jak reálně řešíme problémy. Zjednodušuje všechny kontextuální aspekty času a místa, na kterých se nacházíme, včetně sociokulturních vlivů sloužících jako regulátory cílů a aktivity, které přichází v daném kontextu v úvahu. Právě o tom, jak naše řešení problémů obsahuje ad-hoc improvizaci, píše antropoložka a teoretička HCI oboru Lucy Suchman (1987).

Bez použití Siri bych si za normálních okolností zapnul na příklad budíka na telefonu sám. Taková aktivita by se skládala z několika postupně na sebe navazujících kroků, které by vedly k tomu, že bych otevřel aplikaci Hodiny, v ní našel nastavení budíka, zadal požadovaný čas a svou volbu nakonec potvrdil. Mentální mapa, respektive mentální model aktivity vedoucí k zapnutí budíku v chytrém telefonu je nekomplikovaný. Ale to je spíše historickou náhodou než absolutní pravdou. Pokud by stejný cíl měla splnit osoba, která nikdy neviděla chytrý telefon, protože žije v jedné z posledních existujících domorodých komunit na této planetě, najednou by tento pro nás jednoduchý cíl byl pro domorodého člověka enormně složitý, ba dokonce nemožný. Domorodý člověk totiž nikdy neměl ve své konceptualizaci světa místo pro takové cíle, protože v jeho světě nic podobného neexistuje. Technologie z tohoto pohledu se mi jeví jako médium, které nám rozšiřuje hypotetický mentální prostor možného, nad čím můžeme nebo nemusíme přemýšlet.

Na druhou stranu i pro nás se tato aktivita může jevit složitější, pokud se dostaneme do situace, kde chytrý telefon jen tak neleží na nočním stolku, ale má například vybitou baterii nebo má jiné závady, které nám ztěžují jeho používání. V takovém případě existuje několik variant, jak dosáhnu svého cíle. Dám telefon do nabíječky a počkám, až se nabije na nějakou přiměřenou hodnotu, nebo ihned po zastrčení do zásuvky se budu snažit o zapnutí telefonu, neboť potřebuji rychle do něj zadat nastavení budíku? Protože prostor potenciálních aktivity vedoucích k požadovanému cíli je několik, zdá se mi nevyhnutelné, že v naší mysli existují vědomé, ale i nevědomé selektory, které vybírají, jaké aktivity jsou v daném kontextu nejvhodnější pro dosáhnutí stanoveného cíle.

Jakým způsobem fungují selektory? Představme si, že každý náš cíl je ve vztahu s mentálním mechanismem, který pro nás vybírá vhodnou aktivitu zajišťující dosáhnutí cíle. Tento mentální mechanismus pojmenujme právě selektor. Samozřejmě, jednoho cíle lze dosáhnout mnoha různými aktivitami. Proto selektor musí obstarávat vyhodnocení toho, jak na základě minulé zkušenosti se daná aktivita osvědčila v plnění cíle. Ať už konkrétně vyhodnocení úspěšnosti plnění cílů probíhá jakkoli (bude v tom hrát roli systém odměň v mozku, tzv. „reward system“), selektor přiřadí aktivitě buďto plusové nebo mínusové body, které indikují vhodnost aktivity pro plnění daného cíle. Na Obrázku 2 vidíme takové znázornění vycházející z předchozího schématu

Obrázek 2 Upravený model zpětnovazebního učení s použitím selektoru

Bystřejší čtenáři si jistě kladou otázku, zdali není možné použít více než jeden selektor. Mou odpovědí je, že to možné je a že může existovat několik selektorů, které jsou samy vybrány a vyhodnocovány na hierarchicky vyšší úrovni meta-selektorů. Ale kdo nebo co vybírá z meta-selektorů? Tato hierarchie selektorů nemůže být nekonečná. Což je problém, na který narazili výzkumníci umělé inteligence (UI) v sedmdesátých a osmdesátých letech, když se v rámci staršího paradigmatu symbolické umělé inteligence snažili vyřešit problém vyhodnocení relevance následujících úkonů. Marvin Minsky zavedl do výzkumu UI teorii tzv. framů (rámců)[2], která problém relevance řeší tak, že systém umělé inteligence vyhodnocuje následující stavy na základě datových struktur – rámců, které v symbolické formě podobné jazyku reprezentují formalizované stereotypické situace z reálného života a obsahují programátory explicitně definované relevantní faktografické údaje a akce, které v kontextu rámce „dávají smysl“. Tak například v rámci pojmenovaném „kuchyň“ dává smysl vařit, umýt nádobí, mrkev, nůž a péct koláče, kdežto akce „jít na toaletu“ nebo objekt „Boeing 747“ už o něco méně.

Toto „symbolické“ pojetí umělé inteligence se ale ukázalo jako příliš zjednodušující. Přestože dokázalo řešit obstojně logicko-matematické úlohy jako hraní šachu, úkony jako pohyb a percepce objektů v reálném světě zůstaly příliš komplikované. Problém relevance, který teorie rámců měla řešit, navíc přetrvával. Jak upozornil filosof a fenomenolog Hubert Dreyfus, teorie rámců posouvá problém relevance o jeden stupínek výše. Systém umělé inteligence by sice mohl na příklad podle rámce „kuchyň“ určit přibližně relevanci, co před mechanickými očima systému umělé inteligence se jeví jako relevantní pro další kroky v řešení určitého problémů. Ale Dreyfus upozornil na to (Dreyfus, 1979; Dreyfus, 1992), že systém výběru příslušného rámce opět potřebuje nadřazený mechanismus, který vybere rámec, tedy je potřeba nějaký meta-rámec.

Abychom se vyhnuli nekonečnému regresu, Dreyfus navrhuje fenomenologií inspirované řešení: problém rámce, jak jej Deyfus nazval, představuje mnohem hlubší problém, než se může na první pohled zdát. Protože nepřichází v úvahu, že bychom mohli do systému umělé inteligence vtěsnat ve formálním jazyce deklarovaná všechna fakta, akce a rámce o světě předem, Dreyfus tvrdí, že je to naše žitá zkušenost, naše bytí ve světě, které v konečné instanci definuje, co pro nás ve světě v dané scéně má význam a relevanci a co ne. Dreyfus zde vychází z Heideggerova koncept Dasein tím, že přijímá tezi o bytí člověku jakožto historicky a sociokulturně ohraničeném. Je to kultura, společnost a jejich vývoj, které ovlivňují relevanci objektů a světa kolem nás. Pokud umělá inteligence se má někdo chovat jako člověk (a má vyřešit problém rámce), je třeba, aby měla stejné nebo aspoň podobné zkušenosti světa jako máme my lidé a aby svět sám v mnoha případech stal se svou „nejlepší možnou reprezentací“ (Brooks, 1991): bez toho, aniž bychom vše, co je kolem nás, museli zakódovávat do nějakého formalizovaného symbolického jazyka, využíváme svět jako svou reprezentaci a v mnoha případech si nevšímáme všech částí světa, ale pouze těch, které nám poskytují afordance. Slovem afordance myslím zde především vnímatelné funkce a možnosti k jednání, které nám prostředí kolem nás poskytuje svým vzhledem, formou, materiálem apod. Některé afordance jsou skoro univerzálně pochopitelné napříč kulturami, na příklad klika u dveří nabízí afordanci otevření dveří. Další afordance objektů, jinak také řečeno jejich funkce a významy, jsou ale do velké míry ovlivněné kulturou i kontextem, kde se právě nacházíme. Můj oblíbený příklad je PET lahev, která zjevně nabízí funkci kontejneru na tekutinu a význam plýtvání plastem, ale na druhou stranu může ve vhodném kontextu být ve stejnou chvíli i květináčem v ekologickém zahradničení se zcela opačným a pozitivním významem.

Dreyfusův argument, velmi ovlivněný Heideggerovým Dasein, říká, že k zamezení nekonečného regresu rámců a meta-rámců nám slouží sociokulturní vrstvy a fyzické svět sám, protože vytvářejí strukturální limitaci toho, co je pro nás osobně v dané situaci relevantní a smysluplné. To ale neznamená, že by tyto vlivy působily, s použitím předchozího diagramu, pouze na úrovni aktivit nebo selektorů. Rozhodně na těchto úrovních působí, ale sociokultura a prostředí definují i naše samotné cíle. Samozřejmě, že některé z našich nejzákladnější cilů jako přežít, najíst se, napít se jsou formovány doposud nezmiňovanou vrstvou biologickou, další cíle jako „koupit prsten na svatbu“ jsou více méně sociokulturní, a jestli prsten koupíme v Praze nebo v Ostravě, zde již vstupuje do hry „časoprostorová“ vrstva nejvíce usměrňující naše cíle a vhodné aktivity v kontextu „tady a teď“. Upravený předchozí diagram by po vyobrazení všech zmiňovaných vrstev mohl vypadat viz Obrázek 3.

Obrázek 3 Upravený model zpětnovazebního učení se znázorněním vrstev a jejích vzájemné interakce a spolukonstituce

Co nám současná podoba diagramu zobrazuje? Připomínám, že obsah uprostřed, od cíle přes selektor a aktivity, po výsledek, je abstrakcí mechanismu, který najdeme v nějaké formě implementovaný nejen ve zpětnovazebním učení v současném paradigmatu výzkumu umělé inteligence, ale také v biologickém substrátu našich mozků, které dávají vzniknou naší mysli a kognitivním dovednostem, mezi které patří také řešení problémů. Všimněme si, že jednotlivé vrstvy jsou sice na diagramu oddělené, ale ve skutečnosti existující ve vzájemné interakci a spolukonstituci, což z nich činí mnohem provázanější vrstvy naší reality.

Ve které vrstvě se ale nachází technologie a kde najdeme vysvětlení, které by osvětlilo, proč jsem zničehonic chtěl po Siri udělat něco, co jsem ihned vyhodnotil jako nesmyslné?

Technologie nezapadá na první pohled ani do biologické ani časoprostorové vrstvy. Z tohoto důvodu dává smysl technologii přiřadit k vrstvě sociokulturní. To se zdá jako relativně správné místo, kde bychom měli technologii hledat. Ovšem vzhledem k tomu, jakou významovou bagáž si tento pojem nese, bude lepší udělat nejdříve krok stranou a definovat technologii jako něco, co je úzce svázáno se sociokulturou, ale přesto přináší něco svého a nového, co není možné jen tak integrovat do existujícího pojetí sociálního a kulturního.

Sociálno, jak je studováno sociologií, se zajímá především o lidské aktéry a jejich vzájemné vztahy, které mohou nebo nemusí dávat vzniknout vyšším celkům v podobě rodiny, etnických skupin, národů apod. Kulturním chápu především myšlenky a objekty, které zapadají do jedné z mnoha kategorií uměleckých žánrů.

Technologií pak chápu jako člověkem vytvořené objekty, postupy a procesy, které na začátku svého života vznikají především jako nástroje k řešení konkrétních problémů. Protože ale technologie neexistuje ve vakuu, nýbrž je nedílnou součástí našeho sociálního a kulturního světa, zcela souhlasím s tím, že technologie si nese s sebou i další vrstvu, která je ovlivněná sociokulturou. Ale vlivy sociokultury mají limity. Tak na příklad můžeme si přát, abychom měli v našich chytrých mobilních zařízeních rychlejší internet, a to kdekoli se pohybujeme, fyzikální zákony šíření vln elektromagnetického spektra definují pevně dané limity nezávislé na sociokulturním kontextu. Stručně řečeno, můžeme si vášnivě přát, aby připojení k internetu bylo mnohem rychlejší, ale v konečné fázi vždycky narazíme na limity rychlosti světla, které definují horní hranici rychlosti šíření informací v našem vesmíru.

Technologie tak není amorfní hmota, kterou dokážeme podle naší vůle uhnít do požadované formy, ale má moc se nám vzepřít díky své objektivní materialitě, které nezmizí, ani když změníme náš jazyk popisu, kterým o daném materiálním objektu mluvíme. Na druhou stranu funkce a významy technologie nejsou čistě součástí technologie samotné, ale jsou vytvářeny jako výsledek interakce člověka s technologií v určitých časoprostorových kontextech. Protože technologie ovlivňuje sociokulturu, stejně jako sociokultura ovlivňuje technologii, zdá se, že jejich vzájemný vztah nemá smysl vyobrazovat jako hierarchický, kde jedna strana má větší moc než ta druhá. I proto se mi jeví dnes stál populární deterministické pohledy na technologii a sociokulturu – mezi které patří technologický determinismus a radikální sociální konstruktivismus – jako pohledy, které vždycky vidí jen jednu stranu mince a odmítají se podívat na druhou stranu. Sympatičtější a snad i blíže k pravdě se nabízí přístup k tomuto vztahu, který se podobá vztah, v němž se nachází ostatní vrstvy: vztah úzce propojený a interaktivní. K tomu všemu musíme přihlédnout k Heideggerově příspěvku k přemýšlení nad technologií, neboť v jeho známé eseji Otázka techniky upozorňuje, že technologie není pouze výsledek aplikace vědních poznatků, nýbrž technologické artefakty vždycky byly nedílnou součástí vědeckého pokroku: astronomie by se neobešla bez teleskopu, který zdokonalil Galileo Galilei, podobně výpočet simulace fluidní mechaniky by se neobešel bez hrubé síly nejvýkonnějších superpočítačů dneška. Budeme-li považovat vědu za součást kultury společnosti, pak by diagram vztahu k technologii vypadal viz Obrázek 4.

Obrázek 4 Zoom na vyobrazení vztahu sociokultury a technologie

V mém diagramu se technologie stává nedílnou součástí tohoto světa a podobně jako sociokultura formuje naše myšlení. To se může na první pohled zdát podivné tvrzení, ale jen do té chvíle, než opustíme dlouho vydržovaný pohled na technologii jakožto pasivní kusy hmoty, která sama od sebe nic nedělá a čeká, než jí nějaký člověk (subjekt) nezačne používat a neudělá z ní věc k použití (objekt). Místo toho bychom totiž měli chápat každé uvedení nové technologie tak, že zatřásá technologickým pozadím, na jehož základě jednáme ve světě, protože s sebou přináší nové technologicky mediované afordance, které mění naše psychické i kulturní možnosti.

Pohled na technologie jako médium totiž není nic nového. Ostatně jeden z nejznámějších mediálních teoretiků, Kanaďan Marshall McLuhan (McLuhan, 1991), francouzský sociolog Bruno Latour (Latour, 1994) nebo v současné době filosofové technologie (Ihde, 1990) a Peter-Paul Verbeek (Verbeek, 2016) či mediální teoretik Mark Deuze (Deuze, 2015) považují informační a komunikační technologie za synonymní s médii.

Tento krok není čistě rétorický, ale má dalekosáhlý dosah, neboť v podstatě definuje novou metafyziku vztahu člověka a technologie. Po McLuhanovi, Latourovi, Ihdem a Verbeekovi totiž víme, že technologie jako médium není neutrální a ovlivňuje naše jednání i vztah ke světu. To znamená, že na našem diagramu se musíme na cíle a aktivity nikoli jako na předem dané, kde technologie vykonává pasivně naši vůli, nýbrž jako na pomyslný prostor potencialit, do kterých technologie nám vkládá svým vlivem nové potenciální cíle a nové aktivity pro vykonání těchto cílů.

Latourův oblíbeným příkladem technologické mediace je střelná zbraň. Tvrdí, že zbraň sama o sobě nezabíjí, stejně jako, že nezabíjí pouze člověk. Odkazuje na známé slogany používané v USA pro dlouhotrvající vášnivou diskuzi nad regulací střelných zbraní. Liberálové rádi používají slogan „zbraně zabíjí“, kdežto pravicově a republikánsky orientovaná Národní střelecká asociace (NRA) zas poněkud paradoxně používá sociologickou analýzu, když tvrdí, že jsou to „lidé, kteří zabíjí“, nikoli zbraně. Latour tvrdí, že správný není ani jeden pohled, neboť oba odmítají přiznat, že by argumentace druhé strany mohla obsahovat aspoň část pravdy. Latour tvrdí, že bychom člověka se zbraní měli analyzovat tak, že se jedná o novou entitu člověk-zbraň, která obsahuje nové atributy a potenciál k novým aktivitám, které nenajdeme, pokud budeme člověka nebo zbraň analyzovat zvlášť. Moc zabít a zodpovědnost za zabití je tak distribuovaná mezi člověkem a zbraní.

Můj oblíbený příklad je skicář a tužka, se kterými pracuje umělecky nadaný člověk. Když člověk skicuje, výsledná kresba je málokdy podobná tomu, co si člověk představoval na začátku tvorby. Kresba tak není uložena kompletně v hlavě umělce a on pak pracujeme minuty či hodiny na tom, aby bod po bodu přetvořil již vytvořenou kresbu na papír. Místo toho, jak uvádí Andy Clark (Clark, 1997), lze chápat skicování jako kontinuální interakci člověka, tužky a skicáře, kdy výsledná kresba vzniká tím, že člověk má neustálou zpětnou vazbu na stav kresby, kterou mu poskytuje skicář. Bez této zpětné vazby by umělec kresbu nenakreslil. Můžeme to chápat tak, že skicář je prodlouženou a externalizovanou pracovní pamětí, ze které čerpá informace k následným krokům. Protože skicář hraje tak zásadní roli pro dokončení kresby, měli bychom hovořit o tom, že autorství výsledné kresby je distribuováno mezi umělcem a jeho technologií (skicářem i tužkou). Slovníkem kybernetiky, výsledná kresba je emergentním výstupem interakce komponent nově vzniklého systému člověk-skicář-tužka.

Jak je to s tou Siri?

Když jsem začal používat ve svém životě iPhone a digitální asistentku, můj život a dovednosti, jak řešit každodenní problémy, byly obohacené o nové možné cíle a aktivity, které mohu dělat. V některých cílech Siri působí jako médium, jako v příkladě zesílení hudby, což bych mohl učinit i za pomoci mechanických tlačítek na boku telefonu. Některé cíle jsou díky Siri a obecně iPhonu nové, na příklad odpovídat na zprávy a komentáře v různých sociálních aplikacích. Čím více jsem Siri používal jako médium mezi mým existujícím cílem a výsledkem, tím více se Siri stávala přirozenější volbou pro řešení mých cílům. Na diagramu viz níže Obrázek 5 jsem přidal Siri jako dominantní aktivitu, která zprostředkovává více a více mých cílů. Nevědomky – a zde tkví ono zneužití z prvního odstavce tohoto textu – jsem tak trénoval svůj mozek, aby se postupně učil automatizovat Siri jako přirozenou součást mých kognitivních zdrojů pro řešení problémů ve světě.

Obrázek 5 Upravený diagram o předchozí změny a znázornění Siri jako dominantní activity, která zprostředkovává mé cíle

To by vše mělo doposud v kontextu tohoto textu dávat smysl. Můj mozek se adaptuje na nové prostředí, ve kterém existuje Siri jako aktivita-médium řešící mé problémy, jejichž úspěšné řešení stimuluje můj systém odměň v mozku, který aktivitě „Siri“ přiřazuje plusové body, čímž dochází k nasycení té vážené hodnot (na obrázku 3.7) do takové míry, že daný selektor nikdy nepřechází k jiné aktivitě než k Siri. Selektor pak z důvodu nasycení vážené hodnoty se stává de facto aktivitou jménem Siri. Můj mozek si tedy internalizuje Siri do takové míry, že ji nepovažuje za něco externího mé mysli či kognici a stává se její přirozenou součástí.

Mým spekulativním názorem je, že takto internalizovaný externí artefakt, který se z potenciální aktivity stal více či méně automatizovaným selektorem v mé mysli může způsobit, že můj mozek začne tento selektor-aktivitu jménem „Siri“ používat i na cíle, které dříve nebyly propojené ve vztahu s daným selektorem a aktivitami. Dochází tak k něčemu, co v psychologii bychom mohli nazvat „transferem“ dovedností mezi doménami.

Klasický transfer dovedností a znalostí ve vývojové a edukační psychologii bych nazval transferem „pozitivním“, neboť skutečně můžeme tu samou dovednost vysledovat v jiné doméně. Avšak o jaký typ dovednosti se jedná, zdali vůbec se jedná o nějakou, v mém případě, kdy jsem najednou po Siri chtěl, aby mi přinesla lahev piva z lednice?

Nazval bych to transferem „negativním“, protože transfer internalizované jedné dovednosti (řešit problémy pomocí Siri) zcela nefungují v jiné doméně. Ale podobně jako máme ve formální logice možnost dokázat řešení pozitivně, tak i důkaz sporem, vypůjčím si zde metaforiky důkaz sporem pro to, abych poukázal na to, že i když jsem si velmi rychle uvědomil, že Siri mi nemůže přinést pivo z lednice, má rozšířená mysl o nové možnosti, cíle a aktivity mi hned umožnila si představit, co by bylo nutné, aby mi Siri mohla přinést pivo z lednice. Můj nápad bylo pořídit si chytrou ledničku a chytrého robota, který se dokáže pohybovat a má v sobě integrovanou digitální asistentku. Mé konkrétní řešení ve výsledků nepředstavuje nic relevantního. Mnohem zajímavější je konečný výsledek mého autoetnografického rozboru navazování vztahu s novým telefonem a digitální asistentkou Siri: díky negativnímu transferu dovedností a znalostí jsem dokázal vzít existující technologii a s trochou fantazie si představit zcela nový způsob řešení pro mě tak palčivého problému s pivem. Negativní transfer mi otevřel nové světy, o kterých jsem doposud nevěděl, že je potřebuji, nebo dokonce, že existují.

 

Bibliografie

BROOKS, Rodney A., 1991. Intelligence without representation. Artificial Intelligence [online]. 47(1-3), 139-159 [cit. 2018-05-22]. DOI: 10.1016/0004-3702(91)90053-M. ISSN 00043702. Dostupné z: http://linkinghub.elsevier.com/retrieve/pii/000437029190053M

CLARK, Andy, 1997. Being there: putting brain, body, and world together again. Cambridge, Mass.: MIT Press. ISBN 9780262032407.

DEUZE, Mark, 2015. Media life: Život v médiích. První české vydání. Přeložil Petra IZDNÁ. Praha: Univerzita Karlova v Praze, nakladatelství Karolinum. Studia nových médií. ISBN 978-80-246-2815-8.

DREYFUS, Hubert, 1992. What computers still can’t do: a critique of artificial reason. Cambridge, Mass: MIT Press. ISBN 9780262540674.

DREYFUS, Hubert L., 1979. What computers can’t do: the limits of artificial intelligence. Rev. ed. New York: Harper Colophon Books. ISBN 9780060906139.

IHDE, Don, 1990. Technology and the lifeworld: from garden to earth. Bloomington: Indiana University Press. ISBN 0253205603.

LATOUR, Bruno, 1994. On Technical Mediation. In: Common Knowledge. Vol.3 n°2. s. 29-64.

MCLUHAN, Marshall, 1991. Jak rozumět médiím: extenze člověka. Vyd. 1. Praha: Odeon. Eseje (Odeon). ISBN 80-207-0296-2.

SUCHMAN, Lucille Alice., 1987. Plans and situated actions: the problem of human-machine communication. New York: Cambridge University Press. ISBN 0521337399.

VERBEEK, P.P., 2016. Toward a Theory of Technological Mediation: A Program for Postphenomenological Research. In: FRIIS, Berg O. a Robert C. CREASE. Technoscience and Postphenomenology: The Manhattan Papers. London: Lexington Books, s. 189-204. ISBN 978-0-7391-8961-0.

Poznámky

[1] https://www.theverge.com/2017/7/11/15952654/microsoft-windows-phone-end-of-support

[2] https://en.wikipedia.org/wiki/Frame_(artificial_intelligence)



Jakub Ferenc | Články | Spekulativní genealogie vizuálního myšlení v informační společnosti

Zpět na články

Spekulativní genealogie vizuálního myšlení v informační společnosti

  • jakubferenc
  • Napsáno
  • kategorie: esej / essay / new media / stunome

Sophomore Tina Roh experiences the virtual world that she helps

Credit: Linda A. Cicero / Stanford News Service

Klíčová slova: McLuhan, Flusser, kognitivní schopnosti, Gutenbergova galaxie, virtuální realita, vizuální myšlení

Úvod

Motivací pro následující esej byla otázka položená během semináře Informační politiky. Při dotazu, jak bude vypadat informační společnost za několik let, jsem vyslovil tezi, že společnosti bude dominovat virtuální realita a s tím spojený nový druh myšlení. V průběhu semestru jsem na tuto otázku jednu kratší práci již napsal. Tento text je rozvedení spekulace nad touto otázkou.

Text

Jedna z podkapitol, které se informační politika věnuje, je informační společnost. Ve svém jádru se tento ne příliš stabilní koncept snaží ve skutečnosti o artikulaci něčeho intuitivně zřejmého, tedy že technologie je nezanedbatelný prvek lidského života. Člověk a technologie se vzájemně ovlivňují. Je to druh vztahu, pro jehož popis si rád vypůjčuji terminologii zavedenou oborem kybernetiky, jmenovitě pojmy “zpětné vazby” nebo “zpětné smyčky”, které mi slouží jako vizuální pomůcka k pochopení veskrze abstraktního symbiotického vztahu mezi člověkem a technologií. Abstrakce je nutností, přestože (nebo možná právě proto) každý z nás si dokáže představit hmatatelné příklady i osobní příhody toho, jak je jeho život moderní technologií ovlivňován.

Intuitivní uchopení problému není špatně, ale jako se nespokojíme s vysoce komprimovaným obrázkem ve formátu jpg, tak i v tomto případě při bližším zkoumání něco chybí. Tím chybějícím, jež musí doplňovat naší intuici, je existující a rozsáhlá literatura zabývající se konceptem informační společnosti. Ta nabízí mnoho témat a debat zkoumajících, zdali vliv informací v současné moderní společnosti je něčím výrazně novým, nebo hrály svou úlohu již od nepaměti, případně jak technologie mění od základů struktury našeho myšlení a představu, co znamená být člověkem, jak vidíme v trans- a post-humanistických přístupech k tradičním problémům humanitních věd.

Analýza informační společnosti nevynechává otázky, které se týkající probíhajících změn pracovního trhu a příležitostí. Zkoumání změn pracovního trhu jako odpovědi na nové technologie se vyskytuje v mnoha dílech teoretiků informační společnosti a osobně tuto část analýzy informační společnosti považuji za zajímavou styčnou plochu, kde se setkávají ekonomická, sociologická, a dokonce i kognitivně-psychologická témata.

Ať už si totiž přejeme nebo ne, současný ekonomický systém většiny západní společnosti, kombinující prvky volného trhu a státní regulace, je založen na schopnosti neustále inovovat a ti, kteří toho jsou schopni, získávají finanční ohodnocení a s tím související sociální status. Řekl bych, že mnoho analýz teoretiků informační společnosti v tomto bodě končí. Já se chci ale ptát dále. Máme-li definované soubory hodnot, které jsou ve společensko-ekonomickém systému akcentovány, jací lidé naplňují požadavky na tvůrce těchto hodnot, jinak řečeno, co konkrétně tito lidé umí, znají, a jak se liší jejich kognitivní aparát, že jsou schopni v daném kontextu vyčnívat nad ostatními?

Volba kognice jako vlivného faktoru je opodstatněná, neboť čím dál tím více se ukazuje, že kognitivní schopnosti, inteligence a kreativita jsou důležité faktory ekonomického úspěchu jedinců, komerčních firem, a nakonec i celé společnosti, jestliže společnost vnímáme jako součet jedinců, kteří v ní participují. Termíny jako “creative industries”, “creative economy” nebo “kognitivní kapitalismus”, jež popisují schopnosti oceňované trhem, na teoretické rovině jednoznačně staví na konceptu informační společnosti, neboť ve všech případech podle nich tyto typy současných ekonomik nejen že umocňují důležitost informací, ale zároveň specifikují, že především generování nových a užitečných informací (což je zhruba definice kreativity) je pomyslným hnacím motorem ekonomického růstu.

Co se ale přesně s příchodem informačních technologií změnilo, že najednou inteligence a kreativita mají takovou hodnotu? Jelikož tyto vlastnosti byly více méně vždy přítomny v lidech, včetně jejich nerovnoměrné distribuce, co přesně je na informačních technologiích a společnosti na nich postavené jiné, že zmíněné vlastnosti jsou tak oceňované? Anebo se lze ptát obecněji: co přesně technologie v určitém revolučním období obsahuje, jak je tvořena, že dala vzniknout poptávce po určitých dovednostech a schopnostech? A byly tyto schopnosti vždy přítomny, třebaže jen latentně čekaly na svůj pravý čas, nebo emergence technologie dala vzniknout skutečně novému „vědomí člověka“, jak popisuje Marshall McLuhan ve své knize Gutenberg Galaxy komentující vliv médií na člověka?

McLuhan v knize píše, že teorie kulturních změn se musí opírat o znalosti toho, jak technologické změny mění poměr využívání a důležitosti jednotlivých lidských smyslových orgánů. McLuhan se své teze chopí a analyzuje období evropské civilizace před a po zavedení Gutenbergova tiskařského lisu. Zatímco před jeho uvedením byla společnost predominantně zaměřená na tu část reality, kterou lze vnímat a přenášet orálně, sluchově a hmatově, tiskařský lis a rozmach čteného slova přivedly společnost do nového, vizuálního módu vnímání světa. McLuhan může tak tvrdit, neboť tištěné slovo jako médium přenosu informací bylo nutné vidět. McLuhanův argument je samozřejmě komplexnější, zvláště jeho popis toho, jak lidské vědomí předtiskové období společnosti bylo zahaleno do jednotného, holistického celku, který byl s příchodem tisku a tištěného slova rozparcován do částí, neboť tištěné slovo, kniha a čtení pro sebe jsou velmi individualistické aktivity, jež podle McLuhana vedly (mimo jiné) k vzrůstu individualismu a nacionalismu (MCLUHAN, 157-158) a také poptávce po více mechanickému a kvantitativnímu myšlení a uchopení logiky a dialektiky (MCLUHAN, 159). McLuhana teze, kterou není jednoduché identifikovat, jelikož se “rozplývá” ve fragmentech napříč jeho celou knihou, tkví v ukázání, že technologie a technologické revoluce jsou jednou z nejdůležitějších příčin průmyslových revolucí, které navíc způsobují netriviální kognitivní změny v lidském vědomí a zvýšené sensibilitě, nebo naopak znecitlivění některých z pěti lidských smyslových orgánů. Předtisková doba byla pro McLuhana dobou využívající orální přenos informací a sluchový orgán, kdežto knihtisk nás přetvořil na „gutenbergovského člověka“, jehož předchozí zkušenost mnohosti smyslů je homogenizována a redukována na jeden jediný, jakýsi diktát vizuálního vnímání a myšlení (MCLUHAN, 125). Protilékem proti tomuto pro McLuhana negativnímu trendu byla, v době před internetem, elektrifikace, jež z individualistické společnosti měla nově dostupnou mediální interkonektivitou znovu udělat společnost “globální vesnicí”, neboť “elektrický věk není mechanický, ale organický a chová málo sympatií vůči hodnotám dosažených prostřednictvím typografie, ‘mechanického způsobu psaní’ […]” (MCLUHAN, 135).

Přestože je třeba opatrnost před přílišným zjednodušujícím pohledem na McLuhanovu asociaci revoluce tisku a čtení jako primárně spojených s vizuální kognicí, i po detailnějším prozkoumání knihy mi McLuhanovy teze přijde problematická. Přeskočím-li skutečně triviální tvrzení, že náš zrak musí fungovat, abychom viděli text, který máme číst, narazím na to, že člověk musí dále vykázat znalost jazyka, včetně schopnosti tuto znalost použít pro dekódování lingvistických znaků, jejích významů i pochopení širšího pragmatického kontextu. To jsou pro čtení násobně důležitější úkony než vizuální percepce materiálu, na kterém jsou natištěné nějaké znaky. Tak totiž text vnímá negramotný člověk, který se jako “čtenář” znatelně liší od člověka gramotného. Gramotnost a schopnost manipulace s lingvistickým obsahem jsou primární dovednosti člověka-čtenáře. Jako extrémní, i když validní protipříklad k McLuhanovy lze zmínit osoby, které pro čtení nemohou využívat svůj zrak, tak jak je to v případě zrakově postižených, ale gramotných ve čtení braillova písma. McLuhan přikládá knihtisku, text, “Typografickému nebo Gutenbergovu” člověku nové a přelomové vlastnosti, jež transformovaly evropskou společnost. Skutečně by ale tyto vlastnosti nabyl negramotný člověk, který by vizuálně očima pouze přejížděl řádek po řádku text, jenž by pro něj byl jen shlukem nesrozumitelných a obsahově vyprázdněných znaků?

Takto gramotnost a text určitě revoluci nezpůsobily, čímž lpění na vizualitě čtení jako hlavního prostředku zpracování lingvistických znaků se najednou jeví jako velké nedorozumění. Jakoby McLuhan správně identifikoval symptomy gramotné, gutenbergovské společnosti, tedy onu výše zmíněnou mechanizaci a kvantifikaci myšlení (a tím i vývoj logického myšlení), ale prohodil příčiny. Vizualita a vizuální percepce jsou i do dnešní doby tak obtížně algoritmizovatelné právě proto, že na našich běžných, makroskopických úrovních nevidíme svět v diskrétních jednotkách, ale jako holistický celek. Že svět kolem nás není na makroskopické úrovni diskrétní, ale holistický, byl také problém postavený před matematiku a fyziku 17. a 18. století. Vyřešen byl částečně karteziánskou analytickou geometrií, a konečně až s příchodem diferenciálního a integrálního počtu. Přibližně od druhé poloviny 20. století se ten samý problém uchopení vizuální percepce vyskytl v nově vzniklém oboru Umělé inteligence a později i kognitivní vědě. Výzkumníci těchto oborů se dodnes snaží naprogramovat stroj schopný vnímat vizuální prostor minimálně na takové úrovni, na jaké to zvládne člověk. Holismus vizuálna ale před vědce klade problém, na co se přesně při zpracování vstupních dat má software zaměřit, což implikuje určitou formu definování cílů a schopnosti porozumět významu toho, co se zpracovává. Teprve nedávno pokroky v počítačovém vidění využívající nové komputační metody strojového učení a neuronových sítí dosáhly znatelného pokroku “jen” v identifikaci objektů v prostoru. Skutečnému porozumění vizuální scény to ale nestačí. Počítačové vidění zde naráží na dominantní paradigma kognitivní vědy hlásající, že vizuální percepce a porozumění jejího obsahu stačí symbolická manipulace dat. Na limity tohoto přístupu odpovídá nové hnutí “embodiment cognition”, které pro realistickou tvorbu umělé inteligence rovnající se svými schopnosti člověku, bere v potaz myšlenku, že pro vnímání a porozumění je nutné zahrnout “tělesnost”, neboť jak se zdá, vědomí člověka je na tělesnosti závislé více, než se myslelo. Význam věcí kolem nás je vytvářen také tím, že jsme schopni si v hlavě představit, jinak řečeno simulovat, jaké by to bylo určité věci zažít.

Jestliže McLuhan prohodil příčiny, co je po vynálezu tiskového lisu ta druhá a dle mého správnější příčina mechanizace a kvantifikace myšlení? Odpovědí je linearita. Konkrétně linearita a diskrétnost textu. Zatímco jazyk je pro negramotného člověka automatická a přirozená činnost, gramotný člověk dokáže jazyk problematizovat, neboť si je lépe vědom pravidel konstrukce jazyka, a tak má mnohem lepší předpoklad být schopen reflexe nad tím, jak jazyk formuje myšlení. Psaná forma jazyka k tomu napomáhá tím, že je možné v čase produkci jazyka zmrazit a podívat se na něj z ptačí perspektivy. Stejně tak psaní uživateli jazyka napomáhá s disciplínou konstrukce myšlenek, protože vyžaduje myslet sekvenčně, krok za krokem. Na kognitivní úrovni jednotlivce se tak skutečně dostáváme k závěru, že rozšíření gramotnosti a práce s psaným jazykem přispívá k mechanizaci myšlení, což jsou předpoklady i pro racionální myšlení jako takové, které se minimálně na Západě od osvícenství opírá o sekvenční, kauzální vyvozování logických závěrů. Na kognitivní úrovni lze s McLuhanem souhlasit. Rozšíření čtení psaného textu ukázňuje, mechanizuje mysl.

Abychom ale na základě kognitivních strategií v myšlení mohli hovořit o celospolečenské revoluci, je nutné pochopit, jak se potenciálně užitečná technologie masověji rozšíří, aby vůbec měla tak dalekosáhlý účinek. K tomu poslouží biologická metafora přirozeného výběru. Zatímco všichni lidé se rodí s vrozenou schopností používat jazyk orálně, literární gramotnost je produktem kultury. Tak jako náhodné genetické mutace se v prostředí zachovávají a rozšiřují v závislosti na tom, jakou evoluční výhodu organismu poskytují, tak i kulturou vyvolané vzorce chování se mohou masivněji ve společnosti rozšířit jen tehdy, pokud lidem poskytují nějakou výhodu.

“Na počátku dějin a v průběhu jejich podstatě delšího údobí zůstávala abeceda výsadou elity.” (FLUSSER, 71), píše Vilém Flusser v eseji Alfanumerická společnost mapující působení verbálních a matematických znaků ve společnosti. Gramotnost se před vynálezem tiskového lisu mohla jen velmi těžce rozšířit, protože ruční výroba knihy byla nákladná. Knihy byly luxusní zboží a jako volnočasovou zábavu si jejich pořízení mohla dovolit jen hrstka z celkové populace. Univerzitní systém knihy samozřejmě používal, ale veřejné školství se rozšířilo až v období osvícenství, takže vzdělání bylo opět určené pro úzké spektrum společnosti a většinou bylo organizované kolem praktických povolání nebo filosoficko-teologické výchovy. Většina lidí nepřemýšlela nad tím, jakou roli by knihy a gramotnost měly v jejich životech hrát.

Knihtisk povědomí o důležitosti gramotnosti a vliv textu změnil. Demokratizace přístupu ke knihám znamenala, že více lidí si na základě vlastní zkušenosti dokázalo představit, k čemu knihy a gramotnost jsou nebo mohou být. To pokračovalo jako spirála. Stoupající gramotnost znamenala vyšší poptávku po různých žánrech. Kultivace soukromého a kritičtějšího čtení způsobila, že lidé začali rozeznávat rozdíly mezi autory jednotlivých knih. Prestiž schopnosti psát stoupala nepřímo úměrně prestiži čtení. Jinak řečeno, čím méně prestižní a více demokratické čtení bylo, tím více stoupala prestiž těch, kteří texty produkovali. Postupně vznikl koncept autorství. I proto, že lidé byli dostatečně zdatnými čtenáři, aby rozeznali schopnosti jednotlivých autorů. Společnost přešla nikoli na vizuální mód myšlení, jak tvrdí McLuhan, ale na mód verbální.

Historie nabízí i další precedens, kdy technologický vývoj znatelně začal privilegovat určitý mód myšlení. Podobně si totiž můžeme připomenout počátek uvedení digitálního počítače na začátku druhé poloviny 20. století, kdy počítače byly velké, drahé a nedostupné. Používaly se pro specializované vědecké výpočty. Málokdo přemýšlel nad tím, jaké by to bylo, kdyby uměl programovat, a jaké výhody by mu to přineslo. Bylo nemyslitelné, aby širší veřejnost dokázala porovnat, zdali jeden program je robustněji napsán než druhý, případně zdali je jeden programátor lepší než druhý. To se změnilo po uvedení osobních počítačů a rozšíření internetu. Tyto technologické novinky zapůsobily stejně jako příchod knihtisku: demokratizovaly přístup k informačním technologiím, začlenily počítače hluboko do jádra společnosti, a tím také vytvořily základ proto, aby vyrostla nová poptávka po informačních odbornících, lidech, kteří dokáží myslet a komunikovat nikoli už jen v lingvistických kódech, jejichž hodnota, jak argumentuje Flusser ve své eseji, paradoxně klesá, ale v kódech matematických a algoritmických. Na rozdíl od gramotnosti a knihtisku není možné hovořit o tom, že by počítačová technologie byla před svým masovým rozšířením dostupná jen bohaté vrstvě, protože i lidé, kteří oplývali finančnímu prostředky, tedy lidé například ze sektoru byznysu, netušili, co si o těchto technologiích myslet. Známé jsou citace předních manažerů a vlastníků společnosti, mezi kterými lze najít takové památné ukázky jako prohlášení prezidenta IBM z roku 1943, že celosvětově existuje trh maximálně pro pět počítačů, případně pozdější citace z roku 1977, rok po uvedení prvního osobního počítače Apple, kdy Ken Olsen, spolumajitel tehdy významné počítačové společnosti Digital Equipment Corporation, vyslovil, že nevidí důvod, proč by někdo chtěl mít doma počítač (i když je možné, že cloudové řešení skutečně učiní vlastnění fyzického počítače zbytečným).

Argumentace a posteriori není vůči těmto jinak významným odborníkům příliš férová, protože jak praví známé přísloví, po bitvě je každý generál. Já zde nezmiňuji tyto historické ukázky nepřesných odhadů pro zesměšnění, nýbrž jako hodnotné záznamy o tom, že když i přední odborníci své doby nedokázali předpovědět dopad informačních technologií pár let dopředu, jaká je pravděpodobnost, že toho byl schopný “běžný” občan?

Analogicky ke knihtisku byl pro informační technologie zásadní nejen samotný technologický pokrok, ale také širší adaptace veřejností, která z této technologie učinila nezbytnou páteřní infrastrukturu moderní společnosti, a to do takové míry, že si dnes bez ní těžko dokážeme představit funkční život. Symbiotický vztah počítače a člověka ale vyžadoval nové přístupy k tvorbě informační technologie, což vyústilo ve vzniku nového oboru human-computer interaction (HCI), který začal seriózně studovat psychologické, kognitivní a později i sociální aspekty informačních technologií. Postupně se informační technologie proměnily z ryze ezoterického zájmu několika odborníků a samouků na nové, masové médium, u kterého sociokulturní aspekty jsou stejně důležité jako ty technické. Čím více informační technologie prorůstají společností, tím více je požadován nový “jazyk” přizpůsobený práci s touto technologií.

Lingvistický kód je již neadekvátní, neboť se nejedná o dostatečně přesný a formalizovaný jazyk, který by vyhovoval práci s počítačem. Nový kód pro práci s počítačem vychází z predikátové a výrokové logiky. Spíše, než s konkrétními objekty, je třeba vždycky pracovat s abstrakcemi a zobecněním. Jak popisuje Flusser, dochází k matematizaci společnosti a to nejen proto, aby bylo možné s počítačem pracovat. Obor HCI určitým způsobem se snaží být opoziční silou vůči tomuto trendu, snaží se navrhovat prostředníka, interface, mezi člověkem a strojem, aby nebylo nutné se matematizaci poddat. Avšak práce s počítačem je jen malý kus této další revoluce. Ukazuje se, že matematizace světa funguje velmi dobře, zvláště pokud máme dostatečně výkonné systémy, které jsou schopné poskytovat do nedávna nemožné výpočetní výkony a datové kapacity. Algoritmy nejsou jen prostředkem, jak lidé komunikují s binární logikou stroje, jsou novým pohledem na svět: o softwaru a algoritmech hovoří kognitivní věda, když mluví o tom, jak funguje mozek; matematika a teoretická fyzika užívá fraktálů a jednotky bitu pro popsání toho, jak funguje svět. Počítačová kultura představuje metaforu dominující v této éře naší představivosti stejně jako kdysi mechanické hodinky v době Newtona nebo čtyři přírodní elementy v době antické.

Je třeba upozornit na to, že matematizace nutně nevytlačuje kreativitu. Pouze jí diktuje, s jakým uměleckým materiálem může kreativec pracovat. Omezení ale byla součástí kreativity odjakživa: sochař si volil postavu a materiál, malíř si volil velikost rámů, hudební skladatel volil tóninu, tanečník emoci nebo příběh, básník se zas vědomě a cíleně omezoval, když si místo nekonečného množství způsobů, jak poskládat báseň, volil pevně definovaný žánr sonetu. Lze spekulovat, že kreativita bez omezení není možná.

Proto matematizace kreativity a kreativní algoritmizace nejsou protimluvy, nýbrž reálné popisy toho, co nyní pohání ekonomický vývoj. Vznikají nová pracovní místa a nové obory, které požadují schopnost algoritmizovat řešení ke složitým problémům. Pro tyto obory není přirozený jazyk nutností. Naopak, jeho nepřesnosti jej činí neadekvátním nástrojem. Od verbálního myšlení se dostáváme k formálnímu, algoritmickému, matematickému myšlení.

Tak jako před vynálezem knihtisku existovali lidé, kteří byli výjimečně nadáni pro čtení a psaní a obecně verbální dovednosti, a jejichž talent se mohl výrazněji projevit až tehdy, když nová technologická revoluce požadavek po tomto talentu masově rozšířila, tak i matematická dovednost a formální uvažování byly přítomny ve společnosti, avšak až s příchodem digitálních počítačů a jejich rozšířením do všech koutů společnosti se tyto dovedností staly vysoce vyhledávanými.

Výše zmíněné technologické revoluce mají leccos společného. Jejich působení na existující společenský řád je mimořádné, a to i z toho důvodu, jak se má analýza, která přitakala McLuhanovy, snažila ukázat, že společenské přijetí a proliferace technologie vyžaduje, aby technologie na sebe nabalila společenské hodnoty tak, aby byla společensky užitečná a širší společností uchopitelná. U knihtisku dialog s “uživatelem” nebyl tak potřeba jako u digitálního počítače, který vyžaduje prostředníka v podobě uživatelského rozhraní, které zprostředkovává vztah mezi lidskou kulturou a kulturou stroje.

Vzrůstající role designéra uživatelského rozhraní není náhodná. Technologičtí giganti si dobře uvědomují, že výkon, cloudové řešení nebo vyspělé algoritmy jsou sice nutnou, ale nikoli dostatečnou podmínkou jakéhokoli produktu, jež aspoň v minimální rovině má být používán lidmi. Designéři jsou stavěni do role, ve které se pohybují na pomezí precizního technologického řádu a chaosu lidského světa. Jejich práce se posunula od povrchní fetišizace estetického vzhledu ke komunikaci. Jsou tlumočníky technologie. Jejich designovým materiálem je celé ekologie informačních technologií a lidské emoce. Donedávna designéři pracovali především ve dvourozměrném prostředí bitmapové obrazovky. Na obzoru se ale o slovo hlásí technologie, která pro mě osobně, jako pozorovatele zpovzdálí, představuje možnou třetí revoluci gutenbergovského formátu. Dle mého by mohla dokončit načatou triádu autority určité kognitivní dovednosti. Viděli jsme vládnutí verbálních schopností, dnes stále formálně-matematických. Co je tou potenciální třetí revolucí? Domnívám se, že virtuální realita.

Trvalo několik dekád, než se naskytly příznivé podmínky pro komerční uvedení skutečně imerzivní virtuální reality, která netrpí neduhy v podobě nízkého rozlišení, nepohodlného hardware (či spíše wearable) nebo nedostatku vyspělého a smysluplného softwaru. Nyní velcí hráči na poli technologií berou virtuální realitu seriózně. Microsoft i další firmy představují konceptuální a velmi sofistikované aplikace pro virtuální realitu, které jsou mířeny na studenty, obor medicíny, ale také architekty, umělce a designéry. Poslední zmiňovaní stojí za povšimnutí a historické srovnání.

Knihtisk pro verbálně nadané jedince znamenal urychlení šíření díla od autora ke čtenáři; digitální počítač umožnil matematicky talentovaným jedincům rychleji docházet k výpočtům a řešením složitých, bez digitálních počítačů prakticky nespočitatelných úloh. Co však znamená virtuální realita? A komu tato nová technologie umožní rychleji zprostředkovat své myšlenky?

Virtuální realita je v první řadě médiem vizuálním a prostorovým (a to i přesto, že zapojení dalších smyslů, například vhodného zvukového doprovodu jistě zesiluje realistický pocit z užití VR). Tvorba pro VR tak předpokládá talent pro vizualizaci ve třech rozměrech. Tento talent je tradičně rozložen mezi takové obory jako architektura, produktový design, strojírenství či teoretická fyzika, která také vyžaduje kromě matematického vzdělání schopnosti vizualizace. McLuhan použil pojmy “vizuální myšlení” a “vizuální věk” pro období ovlivněné vývojem knihtisku. Myslím si, že se unáhlil. Virtuální realita je do třetice technologií, která mění, jaký dominantní styl myšlení ve společnosti bude vládnout. A právě ona je vhodným kandidátem na započetí nového věku vizuálního myšlení.

Otázkou je, zda vizuální myšlení je skutečně tak odlišná dovednost, že je platné hovořit o případném historickém období, kdy tato dovednost samostatně dominuje. Jedna z možných odpovědí zní kladně a zároveň propojuje všechny tři zmíněné technologické revoluce a s nimi spojené důrazy na odlišné kognitivní schopnosti.

Podíváme-li se totiž na vědu a praxi testování kognitivních schopností pomocí IQ testu, ten nejpoužívanější z nich, Wechslerův test inteligence pro dospělé (WAIS), se dělí na verbální a non-verbální složku, kde verbální se zhruba dělí na další dvě části: jedna testující jazykové dovednosti a ta druhá dovednosti aritmetické. Neverbální složka, často také pojmenovaná jako vizuálně-prostorová testuje schopnost manipulace s třírozměrnými objekty v mysli a s tím spojené úkony.

Hlavní poznání, které nám rozvržení IQ testu přináší, je fakt, že ze statistického hlediska je užitečné oddělovat verbální, matematické a vizuálně-prostorové dovednosti, neboť nejsou identické a nelze jednou dovedností uspokojivě nahradit druhou bez ztráty cenných informací o dovednostech testovaného subjektu. Neznamená to, že tyto dovednosti jsou na sobě nezávislé nebo že spolu nekorelují. Opak je pravdou, neboť člověk, který vykazuje nadprůměrný talent v jedné doméně, s vyšší pravděpodobností nezaostává i v těch ostatních. Ale rozdíly, respektive poměr rozdělení talentu v těchto třech hlavních kognitivních doménách mezi jednotlivci existují. A proto lze říct, že manifestace lidských potenciálů je závislá na sociotechnických podmínkách dané společnosti. Čím více je ekonomika a kultura ovlivňována jedním dominantních stylem myšlení, tím více se projevuje pro takový styl myšlení nerovnost distribuce nadání mezi lidmi. Za předpokladu, že talent pro vizuální myšlení je ve společnosti rozložen minimálně stejně jako třeba skóre na IQ testu, tedy normálním rozložením (dle Gaussovy křivky), je možné, že po éře literátů, matematiků a programátorů přichází v době virtuální reality nadvláda umělců, architektů a všech, kteří myslí vizuálně.

Na základě předchozích dvou technologických revolucí si dovolím pro vizuální myšlení a virtuální realitu predikci. Pokud se virtuální realita stane běžnou součástí každodenních životů lidí, familiárnost s VR bude dostatečnou ekonomickou motivací, aby se pro VR vytvářely stále detailnější a reálnější HW i SW. Společenská závislost na VR se bude zvyšovat, a tím i prestiž odborníků, kteří se těší talentům, které jim dovolí vytvářet nejen specializované aplikace pro VR, nýbrž komplexní světy, do kterých čím dál tím více budou lidé “outsourcovat” svůj soukromý i společenský život. Z ryze utilitárního a edukačního užití VR se postupně stane životní styl. Estetické a zkušenostní hodnoty se budou dostávat do popředí.

Virtuální realita je oproti té reálné odlišná v mnoha svých atributech, ale jeden z nich vyčnívá: virtuální realita je jediné místo na světě, snad kromě středu černých děr, kde fyzikální zákony mohou, ale nemusí platit. Ten, který vytváří imerzivní, hyperrealistickou virtuální realitu, je omezen v rozhodnutí o tom, jaký virtuální svět to bude, jen svou (vizuální) představivostí.

Pokud ale VR bude k nerozeznání od reálného světa, znamená to, že přestanou existovat morální, etické, souhrnně filosofické otázky, které jsou nedílnou součástí našich lidských životů? Virtuální realita může sloužit jako velký myšlenkový experiment, kde nevyřešené filosofické otázky budou testovány, a je možné, že jiné fyzikální zákony, jiné formy toho, co znamená být člověkem, vhrnou na staré problémy nové světlo generující problémy a otázky nové. Pak se mi ale zdá, že se bez filosofie neobejdeme. Bude ale na těchto nových filosofických otázkách pracovat člověk, nebo nová, virtuální realitu nahrazující technologie, náš poslední vynález, který vyvrcholí ve čtvrtou technologickou revoluci měnící dominantní styl myšlení doby. Doby, ve které se může stát, že slovní spojení “lidský styl myšlení” bude buď archaismus, nebo rovnou oxymóron.

Závěr

Tato esej mapuje pole myšlenek, které se přímo či nepřímo zabývají chápáním technologických revolucí nejen jako sociálních a technologických milníků, ale také revolucí určitého druhu myšlení. Toto myšlení po dostatečném zavedení technologie do širší společnosti pomocí funkce zpětné vazby se začíná privilegovat, čímž jsou zvýhodňováni lidé, kteří mají kognitivní kapacitu a talent tuto poptávku uspokojit. Jako příkladné technologie, jejichž vliv byl v eseji zkoumán, jsem zvolil knihtisk, digitální informační technologie a virtuální realitu, které chronologicky privilegovaly nejdříve verbální, poté matematicko-formální a v poslední řadě vizuální myšlení. Za předpokladu, že distribuce talentu pro vizuální myšlení sleduje Gaussovu křivku, můžeme očekávat, že po vzoru literátů, matematiků a programátorů vznikne nová kognitivní elita, která pro svou práci používá vizuální myšlení. Poptávku po tomto talentu bude stimulovat vzrůstající vliv virtuální reality, jež považuji za silně vizuálně-prostorové médium.


Zdroje

FLUSSER, Vilém, 2013. Alfanumerická společnost. BOSÁK, Petr a Robert JANSA. Proto: grafický design a současné umění. V Praze: Tranzit.cz, s. 73-81. ISBN 9788087259221.

MCLUHAN, Marshall, 1980. The Gutenberg galaxy: the making of tyopographic man. [1st American ed.]. Toronto: University of Toronto Press. ISBN 9780802060419.