Dr. Rand Hindi – How Artificial Intelligence Will Make Technology Disappear

Dr. Rand Hindi – How Artificial Intelligence Will Make Technology Disappear


Hello!
Jó reggelt! Szokott lenni olyan érzésük néha, mintha a telefonjuk rezegne a zsebükben, kiveszik, és nincs rajta semmi? Igen? Igen. Szóval, ez egy igen érdekes dolog, amit fantomrezgésnek hívnak és 10 emberből 9 érezte már. Azt képzeljük, hogy csörög a telefonunk, pedig nem történik semmi. de van erre egy másik szavunk is – találják ki, melyik! A hallucináció. Én eléggé félek tőle, ha jobban belegondolok. Annyira kondicionáltak lettünk a technológia által, hogy egy okostelefon hatására olyasmiket képzelünk, amik nem léteznek. Szóval gondoljuk végig, mi fog történni az elkövetkező 10 évben, ezzel a rengeteg hálózatba kapcsolt géppel. Elárasztanak bennünket. Tudjuk, mi történik, amikor majd minden villanyizzó, szék és asztal a figyelmünkért fog versengeni? Valószínűleg kialakulnak majd bennünk feldolgozási módszerek de elkerülhetetlen, hogy magunk is a rabszolgáikká váljunk. Szóval, Létezik rá megoldás, és ez pedig a mesterséges intelligencia. Hiszen ha belegondolunk hogy miért olyan nehéz ma a technológiát használni, mert emberként nekünk kell erőfeszítést tenni, hogy megtanuljuk egy gépnek a használatát. Valahányszor egy új gépet akarunk használni, meg kell tanulni, hogy működik az adott gép. Minél több technológiát kell használnunk, annál több kognitív erőfeszítésre lesz szükség. De ha mesterséges intelligenciát kezdünk használni, hogy jobban megértessük magunkat ezekkel az eszközökkel, hogy a természetes nyelvünkön kommunikáljanak, akkor többé nem kell megtanulni őket használni. Nem kell megtanulnunk, hogy működik a TV, vagy a kávéfőző, csak kérni kell tőle amit szeretnénk, ugyanúgy, ahogy velem sem kell megtanulni beszélgetni, hiszen közös a nyelvünk. ha elkezdhetnénk AI-t rakni minden ilyen eszközbe, talán újragondolhatnánk, azt ahogy kommunikálunk velük. A mesterséges intelligencia igen gyorsan növekszik, nyilván tudják, hiszen ez az oka, hogy ma erről beszélünk, én pedig mázlista vagyok, hogy a kutatási területem ilyen menő lett. Nem valami forradalmi új algoritmus az oka a deep learning már évek óta jelen van. Igazából két tényező összetartása az oka, az egyik a majdnem végtelen és ingyenes számítási kapacitás, amit bárki használhat. Amikor a PhD-met írtam 10 évvel ezelőtt, nem volt még felhő. Volt az egyetemen egy kis számítógép-klaszter, de nagyon nehéz volt bármit működtetni 400 node-on. Ma, valószínűleg pár perc alatt összedobnám a laptopomon. A másik, az AI-k betanításához szükséges elérhető adatmennyiség. Nézzük innen: Exponenciálisan növekszik a számítási kapacitás, exponenciálisan növekszik az elérhető adatmennyiség ennek a kettőnek az összekapcsolása teremti azt az őrült sebességet, amivel az AI alkalmazkodik. Elképzelhetünk egy pontot a jövőben, amikor a mesterséges intelligencia képességei messze meghaladnak bármilyen problémát, és bármilyen tevékenységet, amit gépek végeznek, és azt gondolom, hogy ezen a ponton az ezekről az összekapcsolt eszközökről alkotott percepciónk az lesz, hogy azok teljesen eltűnnek. Olyan lesz, mint az elektromosság. Az elektromosság annyira intuitívan használt dolog, hogy senki nem jött be a terembe úgy hogy “Úristen, elektromosság mindenütt!” Senki nem foglalkozik vele, mert elfelejtettük. És ha a körülöttünk levő gépek úgy tudnak majd beszélni, ahogy mi az emberekkel, akkor nem fogunk többé gondolni rájuk. El fognak tűnni a tudatunkból. Szóval mit értünk az AI alatt? Ez egy kicsit műszakibb jellegű, szóval hátha valaki tud nekem mondani egy definíciót az AI-ra. Ön úgy néz ki, mint aki tudja. Igen, szóval, mi a mesterséges intelligencia? Szóval, látják, ez benne a nehéz, mindenki az AI-ról beszél,
de még egy definíciónk sincs róla. Én úgy szoktam rá gondolni hogy az emberi viselkedés reprodukálása egy gépben. A mesterséges intelligenciában sok technika létezik erre, és az egyik nagyon népszerű ezek közül a a gépi tanulás. A gépi tanulás elve, hogy ahelyett, hogy egy számítógépet beprogramoznának valaminek az elvégzésére példákat mutatunk neki a megtanulandó viselkedésre, amit az magától megtanul reprodukálni. Ez nagyon fontos, mert azt jelenti, hogy többé nem kell egy emberi szakértő, akinek meg kell próbálnia megérteni, mit akarunk automatizálni, elég csak adatot gyűjteni arról, mit akarunk automatizálni és betáplálni a gépbe. Tehát elmozdulunk a számítógépek programozásától afelé, hogy megtanítjuk gépeknek, mit kell csinálniuk. Mivel sokkal egyszerűbb adatokat gyűjteni valamiről mint megírni egy profi programkódot. Továbbá sokkal nagyobb automatizáltsághoz jutunk sokkal nagyobb sebességen. A gépi tanuláson belül van egy specifikus algoritmus család, amit úgy hívunk “deep learning” A deep learning elmélete nem bonyolult. Nagyon távolról az agy neuronhálózataihoz hasonló. Képzeljük el hogy minden pont egy neuron. Ami igazából csak egy menő kifejezés arra hogy egy szám. Ezek a neuronok összekapcsolódnak egymással. és információt adnak át egymásnak. Mi történik akkor ha adunk neki egy képet egy macskáról? A macska minden pixele egy neuront jelent az első rétegen. Sok-sok ilyen képet megnézve és azokat kombinálva elkezdhet megtanulni olyan fogalmakat, mint pl. a körvonal. Ha elég gyakran lát ilyet a képeken, megtanulja hogy ez a “körvonal”. így, hogy ismeri a körvonal fogalmát, kombinálja azt és absztrakt ábrázolásokra lesz képes. amilyen pl. a macska is. Így amikor egy macskát lát, meg tudja jósolni, hogy ez egy macska. A gondolat nagyon egyszerű, ami izgalmas benne: hogy az ember egyetlen egyszer sem írta le, mi az a macska. Hagyományosan, a deep learning előtt előbb meg kellett írni a programot megnézem a kontúrokat, ha szőrös
és van két hegyes füle akkor macska.
Szóval leírást kellett adni, milyen, hogy felismerje. Ma erre nincs szükség. Csak betápláljuk a képeket, az pedig megtanulja, hogyan ismerje fel. Ugyanezt használjuk az önvezető autókban.
Ezt használjuk az orvosi képalkotásban. Ez működik az olyan dolgoknál is, mint az ún.
stílus transzfer. Ez egyébként nagyon érdekes. Meg lehet tanulni egy kép stílusát reprodukálni. Pl. itt vannak Van Gogh festményei, amelyeknek a stílusát egy másik képre alkalmazzuk. Tehát veszünk egy képet, ez éppenséggel egy jó kép,
de vehetünk egy szörnyű rossz képet is, és Van Gogh festmény lesz belőle. Szóval ma már ilyen is lehetséges.
Ez egyébként egy elég régi technológia. Még néhány mostani érdekesség: ma már generálni is lehet ilyet: van pl. egy algoritmus, ami veszi az általunk rajzolt vázlatot, és nagyfelbontású rendert készít belőle Gondoljuk végig ennek a jelentőségét az építészetben,
a tervezésben, a divatban, hogy innentől bárki tervezhet bármit, egyszerűen úgy, hogy lerajzolja, és nem kell megtanulnia annak a sok programnak a használatát. Ugyanez az algoritmus verte meg a go világbajnokot, ami egy fontos mérföldkő volt, mert azt tíz évvel későbbre becsülték. A sakkal szemben itt az a különbség, hogy a sakkot sima brute force használatával is meg lehet verni, egyszerűen rengeteg kombináció kiszámításával. De a go játéknak annyi kombinációja van, hogy
csak úgy lehet nyerni, ha játsszuk magát a játékot. És ezt egy nagyon érdekes módon tették. Vettek egy gépi tanuló algoritmust, tehát egy olyan neurális hálózatot, és egy másik ilyen hálózattal szemben játszatták. Millió és millió játszmát lejátszottak, és eközben mindvégig tapasztalatokat cseréltek.
Ezt megerősített tanulásnak is hívják. És ezáltal gyakorlatilag megtanulták a játékot. Képzeljük el hogy Ön és én egymillió go játszmát játszottunk le, miközben végig tanítottuk egymást és minden lépésnél tapasztalatot cseréltünk.
Egy idő után elég jók volnánk, nem? Abban az időben, mikor ez történt, az akkori világbajnok 5 játszmából 2-t megnyert vele szemben. Ma már senki nem tudja megverni a gépet, mert az azóta is fejlődött tovább. Egyre jobb és jobb lett, és egy ponton emberfelettivé válik. De azért van olyan is, amiben még mindig nem vagyunk ennyire jók. És ez a nyelv. Ennek oka, hogy a nyelv igen nehezen megérthető egy gép számára. Ha megkérjük az asszitensünket — épp most sorsoltak ki egy Alexát, ami szerintem nem túl jó ötlet… szóval ha felteszünk egy egyszerű kérdést pl. mint “londoni időjárás”, ez könnyű mert semmi kétértelműt nem tartalmaz. A londoni időjárás a kérdés, amit bárki meg tud válaszolni. De nézzünk egy kicsit érdekesebbet, kérdezzük pl. ezt: “keress egy olaszt a londoni AirBnb szállásom mellett.” Amire először rá kéne jönni, hogy az “olasz” az egy helytípus. Hiszen szemantikailag teljesen korrekt odamenni valakihez az utcán és megkérdeni: “elnézést ön olasz?” De valószínűleg nem ez az, amit keresünk. Valószínűleg megijednénk, ha az AI felhozna a lakásba egy olaszt. De az hogy “londoni AirBnb”, teljesen értelmetlen a gépnek, hiszen ez nem egy cím, vagy hely, hanem valójában egy hivatkozás valamire, aminek a mi kontextusunkban van értelme. Hiszen az én londoni AirBnb-m nem az ön londoni AirBnb-je. Tehát a nyelv megértéséhez először külső kontextusoknak a mondatelemzésbe való integrációjára van szükség. Ezért kell olyan sok adat egy adott emberről, ismerni kell az emailjeit, a naptárát, a helyszínelőzményeit, hozzá kell férni az sms üzeneteihez. Minél több információnk van az adott személyről, annál több adatunk van a kontextusról melyben vannak és annál könnyebb a félreértések tisztázása. Így értelmezhetővé válik egy AirBnb helyszínszolgáltató, mivel vannak ilyen emailek tőlük, melyek közül az egyikben szerepel London, és a dátuma megfelel a mai napnak, következésképpen ez a cím, amit keresünk. Ha külső adatokat, és kapcsolatokat adunk a mesterséges intelligenciának, egyértelművé tehető az emberi nyelv És ez egyébként nagyon nehéz. A gond persze az, hogy azt látjuk, mindenhol ez történik, ezekben az otthoni asszisztenseknél. Mostanában minden egyes eszközünknek hangasszisztense van, mintha ez lenne most az új nagy szám. A televíziónk – szeretem ezt a példát mert pl. tudjuk milyen nehéz egy tévét használni. Keresünk egy műsort, de fogalmunk nincs, hol adják. Csak szólnánk a tévének: “kapcsolj a focimeccsre!” –
és működne. Ugyanez az autóval: Nem tudom, Önök hogy vannak vele, de nem szeretem, mikor télen a hidegben vezetek, és fogalmam sincs, hogy kéne a szélvédő párásodást megszüntetni. úgyhogy csak lehúzom az ablakot, és akkor megint fázom, Csak azt mondanám az autónak, “távolítsd el” és kész. De nem szabad elfelejtenünk, hogy mindezek az eszközök, folyamatosan 24/7-ben hallgató módban vannak, hiszen definíció szerint is a nevük kimondásával “hey, Alexa, Siri, akármi” triggerelhetőnek kell lenniük. amihez folyamatos figyeló módban kell lenniük. És ugye az emberek megkérdezik, vajon mi lesz mindazzal a sok adattal. Mi lesz, ha telerakom a lakásomat ezekkel az eszközökkel? Mert lehet, hogy azt gondoljuk, mindegy, úgyis tudom, mi triggerel, de valójában az összes ilyen home assistant eszköz, ezek is triggerelnek egyszer pár óránként, véletlenszerűen. Félreértik és azt hiszik “Alexa”-t mondtunk, pedig valami mást, és aktiválódnak. Tudnunk kell, hogy ilyenkor rögzítenek egy kb. 10 másodpercnyi beszélgetést, amiről mi nem tudunk, hogy megtörténik. Ezt pedig a felhőbe küldi feldolgozásra.
És ebből pedig elég sok gond lehet. Szerencsére itt Európában készülődik a GDPR, ami elég nagy dolognak tűnik. És ennek nagyon örülök. A legtöbb ember nem tudja, de ha van az otthonunkban egy Google Home eszköz vagy Alexa Amazon, Akkor technikailag, mivel a hang a felhőben kerül feldolgozásra, így explicit engedélyt kellene kérnie minden személytől, akinek a hangját rögzíti. Képzeljük el, hogy vacsorára hívtunk 10 embert az otthonunkba, elméletben, ha valóban betartjuk a törvényt, akkor mind a tíz ember engedélyét el kéne kérnie. ami egy őrület lenne. Ha itt most van egy iPhone-unk, és azt mondjuk: “hey, Siri”, akkor az aktiválódik, és hallgat. Szóval akkor jelenlévők száma, szorozva jelenlévők számával, ugye el tudjuk képzelni. És ez egy elég nagy probléma. De vannak módok ennek orvoslására. A “tervezett magánélet” mint olyan, végre jelent valamit, különösen az AI-t figyelembe véve. Például létezik olyasmi, mint az adatok közvetlenül az eszközön való feldolgozása. Ne feledjük, hogy ezek azért igen erős számítógépek. És az a helyzet hogy ma már egy adott eszközön belül is lehetséges deep learning végzése. A cégemnél létre tudtunk hozni egy hangasszisztenst, end-to-end deep learning-gel egy Raspberry Pi-n. Tehát még arról sincs szó, hogy egy rendkívül erős chip kell hozzá. Egy átlagos, öt dolláros hardver elég hozzá, hogy az elérhető legfejlettebb mesterséges intelligenciát futtassuk rajta. Ami felveti a kérdést: ha ez megoldható egy eszközön, anélkül, hogy a felhőbe küldenénk adatot, Akkor miért tennénk mégis? Talán értékesítik az adatokat?
Vagy csak nem tudják, hogyan kell csinálni? – utóbbi esetben viszont nem igazán bíznám magam erre a cégre. Eléggé kényes vagyok minden, biztonságos számítástechnikával kapcsolatos dologban. Igazából eléggé meg vagyok győződve, hogy remélhetőleg a következő pár évben rendelkezésre fog állni pl. a homomorf titkosítás ezekben az AI rendszerekben Ezek azok a dolgok, amiket igazán várok. És amiért erről beszélek, nem tudom, Önök hogy vannak vele, de már gyerekkorom óta mindenki azt mondja, hogy a jövő valami ilyesmi lesz: egy nagyon elnyomó, sötét, szürke világ, magas szürke, reklámokkal borított épületekkel
és állandó rendőri jelenléttel. De amikor beszélgetek emberekkel,
és azt kérdezem tőlük: Milyen jövőt akarnak? Nos, mindenki valami ilyesmit mond. Senki nem egy elnyomó jövőt akar, az emberek békességet akarnak, mint amikor nyaralnak, és én igazán azt hiszem, hogy a mesterséges intelligencia erről szól. Hogy a technológia eltűnjön, és mindenkor úgy érezhessük magunkat, hogy valóban kikapcsolódunk. Köszönöm.