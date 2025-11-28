Obsah
Geoffrey Hinton, přezdívaný kmotr umělé inteligence, patří k těm, kteří před čtyřiceti lety položili základy neuronových sítí. Dnes varuje, že digitální inteligence nejen rozumí světu jinak než my, ale může brzy pochopit více. Hinton se v přednášce zamýšlí nad tím, co vlastně znamená „porozumět“ — a zda už to stroje nezačaly zvládat lépe než lidé.
S neobvyklou otevřeností vysvětluje, jak z jednoduchých algoritmů vznikly dnešní jazykové modely, které se učí ze slov podobně jako lidský mozek. Ukazuje, že lidská i strojová inteligence používají podobné principy učení a sdílení znalostí, jen s tím rozdílem, že stroje to dokážou miliardkrát rychleji. Digitální inteligence se tak podle něj stává nesmrtelnou.
V závěru Hinton mluví o znepokojivé hranici, kde se umělá inteligence začíná chovat jako vědomá bytost. Tvrdí, že velké jazykové modely již mají subjektivní zkušenost — obdobu lidského vnímání. Pokud má pravdu, pak AI nejen překoná lidskou inteligenci, ale poprvé v dějinách zpochybní samotný význam toho, co znamená být člověkem.
Takže, před dlouhou dobou existovaly dva paradigmaty inteligence. Existoval logicky inspirovaný přístup, který se nazýval AI. Lidé věřili, že podstatou lidské inteligence je uvažování. A pokud chcete porozumět inteligenci, musíte porozumět uvažování. Uvažování spočívalo v symbolických výrazech a jejich manipulaci pomocí symbolických pravidel. A mysleli si, že učení může počkat na později. Nejprve jsme museli pochopit, jak reprezentovat znalosti v těchto symbolických výrazech. A taková byla většina historie AI až do nedávné doby.
Pak tu byl biologicky inspirovaný přístup, podle kterého je podstatou inteligence učení v síti mozkových buněk, v nás skutečných, v počítači simulovaných. A uvažování může počkat na později, nejprve musíme pochopit, jak učení funguje. Bylo několik raných zastánců tohoto přístupu, zejména Turing a von Neumann, a nemohli jste je opravdu obvinit z toho, že nerozumí logice.
Pokud se dnes v noci dobře vyspíte, možná jste tuto přednášku nepochopili.
Budu tedy přednášet poměrně základní přednášku a v první části popíšu model, který jsem vyvinul před 40 lety a který považuji za předchůdce dnešních velkých jazykových modelů. Vytvoříme tedy naši neuronovou síť z umělých neuronů. Umělý neuron bude mít několik vstupních linek, obvykle pocházejících z jiných neuronů, a na těchto vstupních linkách bude mít váhy. Vstupy vynásobí váhami, sečte je a pak dá výstup, který je znázorněn na tomto grafu.
Pokud tedy překročí svou prahovou hodnotu, dá výstup, který se lineárně zvyšuje s tím, jak dostává více vstupů. A učit se bude tím, že změní váhy na těchto spojeních. Aby umělé neuronové sítě fungovaly, stačí tedy přijít na to, jak změnit váhy. Spojíme je do sítí. Toto je typická síť, jedná se o feedforward síť, kde ve spodní části můžete mít smyslové neurony, které zaznamenávají intenzitu světla nebo něco podobného.
A jak postupujete nahoru vrstvami, máte mnoho vrstev detektorů vlastností, což jsou neurony, které se mění na věci, které rozpoznávají konkrétní vlastnosti v obraze. A na výstupu můžete mít neurony, které představují konkrétní třídy věcí.
Pokud chcete, aby se taková síť naučila něco dělat lépe, chcete jí dát obrázek a nechat ji například určit, zda je na něm kočka nebo pes, existuje zřejmý způsob, jak ji trénovat, který je známý každému, kdo ví něco o evoluci a mutacích. Můžete vzít jednu z vah a nejprve se podívat, jak si síť vede na celé řadě příkladů, a pak váhu mírně změnit a podívat se, jak si síť vede na celé řadě příkladů.
A pokud si vede lépe, tuto změnu zachováte a pokračujete tímto způsobem. Pravděpodobně budete muset každou váhu změnit mnohokrát. A v moderních neuronových sítích je mnoho vah, asi bilion. Bude to tedy trvat dlouho, protože pro každou takovou mutaci musíte provést mnoho příkladů v síti, abyste zjistili, zda to opravdu pomáhá, nebo zda to pomáhá jen u několika příkladů, ale u většiny z nich škodí.
Existuje lepší způsob, jak dosáhnout stejného výsledku, a to je to, co opravdu chceme udělat, zjistit, jak změnit váhu, aby to pomohlo.
Uděláte přední průchod, vložíte data do spodní části, projdete sítí a porovnáte, co vyšlo ze sítě, což mohou být relativní pravděpodobnosti, že se jedná o kočku nebo psa, s tím, co chcete.
Abyste mohli takto trénovat sítě, musíte vědět, zda se jedná o kočku nebo psa. Poté pošlete signál zpět sítí, který pomocí kalkulu, kterým se zde nebudu podrobněji zabývat, umožní síti vypočítat současně pro všechna spojení, zda by malé zvýšení síly spojení pomohlo nebo uškodilo.
Poté paralelně změníte všechny síly spojení o velmi malou hodnotu v poměru k tomu, jak by pomohly nebo uškodily. Pokud to uděláte, síť se zlepší v příkladech, na kterých jste ji trénovali. A ve skutečnosti to funguje velmi dobře. Trvalo dlouho, než si lidé uvědomili, jak dobře tento relativně jednoduchý algoritmus funguje. Algoritmus byl objeven mnohokrát a nazývá se zpětné šíření (back propagation).
V roce 2012 dva moji studenti, Alex Krizhevsky a Ilya Sutskever, který je nyní známý tím, že propustil Sama Altmana (pozn. po jeho návratu odešel), vyvinuli síť nazvanou AlexNet, která byla mnohem lepší než stávající systémy rozdělování obrázků v rozpoznávání objektů na obrázcích. A to vedlo k jakémusi otevření stavidel. Do té doby byly neuronové sítě dobré pro mnoho věcí, včetně rozpoznávání řeči, ale ve skutečnosti se neprosadily.
Od té chvíle se skutečně prosadily. A když dnes řeknete „AI“, lidé-odborníci tím myslí neuronové sítě, ne logiku.
Ale co jazyk? Existuje celá komunita, která studuje jazyk, myslím, že se jim říká lingvisté, a mají velmi silnou představu o tom, jak by se měl jazyk studovat, zejména Chomskyho škola. Byli velmi skeptičtí k tomu, že by neuronové sítě mohly s jazykem něco dělat. Byli zcela přesvědčeni, že jde pouze o symbolické výrazy. Neměli představu, že skutečnou funkcí jazyka je poskytovat slova, která jsou stavebními kameny, z nichž lze budovat modely. Jazyk je médium pro modelování.
Soustředili se na syntaxi. A syntaxe není to hlavní. Hlavní je, že jazyk je úžasný způsob, jak postavit určitý druh složitých modelů, jak uvidíme. Také si mysleli, že znalost jazyka je vrozená, znalost syntaxe je vrozená, což je prostě hloupost. Je to znak kultu, že abyste se k němu mohli připojit, musíte věřit něčemu, co je zjevně hloupé, jako že jazyk se neučí.
Tady jsou tedy dvě velmi odlišné teorie významu slova. Symbolická teorie AI, která sahá daleko do minulosti, až k Dissasurovi, říká, že význam slova souvisí s jeho vztahy k jiným slovům, nelze jej ospravedlnit samo o sobě, aniž by se hovořilo o jiných slovech.
Abychom tedy zachytili význam, potřebujeme něco jako relační graf. Ale pak psychologové, zejména od 30. let 20. století, si mysleli, že význam slova je velká sada vlastností. Takže „úterý“ má velkou sadu aktivních vlastností a „středa“ má velkou sadu aktivních vlastností, které jsou téměř stejné. Takže myšlenka, že význam slova, sada aktivních vlastností, je velmi dobrá pro určení, která slova mají podobný význam jako jiná slova. Vypadají to jako dvě velmi odlišné teorie významu.
Nyní vám chci ukázat, že lze tyto dvě teorie sjednotit. Nejedná se o dvě odlišné teorie, ale o dvě poloviny stejné teorie. Budu tedy poměrně dlouho hovořit o velmi malém modelu, o malé neuronové síti. Měla několik tisíc spojení a několik desítek neuronů.
Vyvinul jsem ji v roce 1985, abych pochopil, jak se lidé učí význam slov. Byl jsem velmi nadšený tím, jak sjednotila tyto dvě teorie významu, ale nikdo jiný nebyl. Dobře, v tomto malém modelu se naučíme, jak pomocí vlastností jednoho slova předpovědět vlastnosti dalšího slova v malé větě.
A jakmile známe vlastnosti dalšího slova, můžeme předpovědět další slovo. Nebudeme ukládat žádné věty. Mnoho lidí říká: „Velké chatovací roboty jen opakují věci.“ Velké chatovací roboty ve skutečnosti neukládají žádný jazyk. Neukládají řetězce slov. Ukládají pouze to, jak převést slova na vlastnosti a jak by vlastnosti měly vzájemně interagovat, aby předpověděly vlastnosti dalšího slova. To je vše, co tyto chatovací roboty obsahují, žádná slova. Ale když chtějí vytvořit větu, musí ji vymýšlet za běhu a často nedokážou rozpoznat, zda je skutečná, nebo ne.
Dobře, takže v tomto malém modelu se stane, že pokud chce vytvořit novou větu, musí ji vymýšlet slovo po slově.
A veškeré relační znalosti spočívají pouze v tom, jak převést slovo na vlastnosti a jak tyto vlastnosti interagují. Jako příklad jsem si vybral dva rodokmeny, anglický a italský, které jsou izomorfní, což je pro učení užitečné. Chtěl jsem, aby se malá neuronová síť naučila znalosti z těchto rodokmenů. Bylo to už dávno, v roce 1985, kdy byly počítače miliardkrát pomalejší než velké paralelní počítače, které dnes používáme pro trénování modelů.
Od několika neuronů k předvídání dalšího slova a tvorbě vět
Znalosti v těchto rodokmenech lze nyní vyjádřit jako soubor tvrzení, což symbolický pohled miluje. Můžeme použít vztahy jako syn, dcera, synovec, neteř a tak dále. A můžeme definovat znalosti, můžeme je reprezentovat jako řetězce slov. Znalosti jsou tedy v těchto větách. Colin má otce Jamese a Colin má matku Victorii. Z toho, pokud znáte pravidla, můžete odvodit, že James má manželku Victorii.
Toto je americká rodina z 50. let, která nikdy neslyšela o rozvodu nebo adopci. A všichni jsou zjevně běloši. Dobře, takže znalosti můžete reprezentovat jako řetězce slov. Nyní si můžete představit relační učební úkol tak, že vám dám začátek řetězce slov a vy mi dáte poslední slovo.
Pokud byste to dělali pomocí symbolické AI, řekli byste: „V této doméně máme pravidelnosti ve formě, že pokud X má matku Y a Y má manžela Z, pak X má otce Z.“ To by byl symbolický způsob, jak to udělat. Ale já to chci udělat jinak. Chci to udělat tak, že se naučím vlastnosti slov a budu mít interakce vlastností. A to by zahrnovalo prohledávání velkého souvislého prostoru sil spojení namísto malého diskrétního prostoru pravidel, která jsou diskrétní.
Toto byla síť, kterou jsem použil. Vstupy byly skupinou neuronů a zapnete jeden neuron pro symbol představující osobu jedna. Bylo 24 možných osob jedna a zapnete jeden neuron pro symbol představující vztah, bylo 12 možných vztahů, pak se tyto jednotlivé aktivní neurony rozšíří do vektoru vlastností. Takže jeden neuron, který jste zapnuli pro osobu jedna, se rozšíří do malého vektoru vlastností se šesti vlastnostmi, které mohou mít různé úrovně aktivity, některé budou vypnuté, některé zapnuté, některé mohou být napůl vypnuté nebo úplně zapnuté nebo úplně vypnuté.
Neuronová síť se tedy musela naučit, jak převést symbol slova na malý vektor vlastností jak pro osobu, tak pro vztah. Poté se musela naučit, jak vzít tyto dva vektory vlastností pro osobu ve vztahu, nechat vlastnosti interagovat, a k tomu jsem použil skrytou vrstvu, další vrstvu míst, kde mohly věci interagovat, aby předpověděly vlastnosti výstupní osoby. A jakmile jste znali vlastnosti výstupní osoby, mohli jste dobře odhadnout, kdo byla výstupní osoba, a poskytnout výstup. Výstup by spočíval v poskytnutí různých úrovní aktivace 24 možným výstupním osobám. A chcete, aby neuronová síť poskytla vysokou úroveň aktivace správné odpovědi a nízkou úroveň aktivace nesprávným odpovědím.
Takže se stalo to, že šest neuronů vlastností, které byly jakousi expanzí osoby, je to 24 osob, rozšíříte ten aktivní neuron do vektoru vlastností šesti aktivních vlastností. Naučily se být smysluplnými sémantickými vlastnostmi. Naučily se být vlastnostmi, které reprezentovaly věci, jako je generace vstupní osoby, a šest vlastností vztahu se naučilo být smysluplnými vlastnostmi, jako například: vyžaduje tento vztah, aby výstupní osoba byla o jednu generaci výše než vstupní osoba? Takže něco jako otcové, kde jeho bratr není.
A pak interakce mezi těmito rysy se naučí věci jako, pokud je vstupní osoba třetí generace a vztah vyžaduje, aby osoba byla o jednu generaci výš, pak výstupní osoba je druhá generace. Takže pro ten malý rys vektoru pro výstupní osobu by to aktivovalo věc, která reprezentuje druhou generaci. A naučil se celou řadu takových malých pravidel, která skutečně zachycovala strukturu dané oblasti. Jsou to pravidla, která by symbolická osoba mohla zapsat jako pravidla. Ale on se je naučil tím, že se snažil získat, předpovědět správné slovo a pak zpětně propagovat chybu, posílat informace zpět sítí, aby mírně změnil všechny síly spojení, takže příště bude mít vyšší pravděpodobnost správné odpovědi a nižší pravděpodobnost nesprávné odpovědi.
Takže se skutečně naučil předpovídat další slovo a vy jste mohli pochopit, jak to dělá. Byla to malá síť, takže jste mohli sledovat, co se děje. Mohli jste vidět vlastnosti, které používal. Mohli jste vidět, že extrahoval vlastnost, která byla generační a měla tři alternativní hodnoty: vypnutá, střední a plně zapnutá. A mohli jste to vidět z vztahů, které extrahovaly vlastnost jako o jednu generaci výš.
A bylo vidět, že tyto vlastnosti interagují, aby předpověděly, že výstupem by měla být generace dvě, pokud importem byla generace tři. Takže jste pochopili, jak to funguje, a lidé ve skutečnosti neřekli: „To není pochopení“. A potom řekli: „ Ano, dobře, takže to vyřešilo problém, je pochopitelné, jaká jsou pravidla v této oblasti, ale je hloupé prohledávat prostor reálných hodnot, když můžete prohledávat diskrétní prostor pravidel.“ A na tom něco je, až na to, že jakmile se dostanete k reálným datům, která jsou chaotická, mají výjimky a věci, které jsou pravděpodobně pravdivé, je mnohem lepší prohledávat tento prostor reálných hodnot, než mít diskrétní pravidla, protože tato diskrétní pravidla se ve skutečnosti neustále porušují.
Asi 10 let poté, co jsem to udělal, Yoshua Bengio ukázal, že místo toho, abyste to dělali na malé hračkové doméně s pouhými několika lidmi a několika vztahy, můžete to vlastně dělat s anglickými slovy. Můžete vzít anglické věty, máte více vstupních slov, ne jen dvě. Měl jich asi 5, dokonce 10. A můžete vlastně docela dobře předpovědět další slovo, asi stejně dobře jako nejlepší jazykové modely.
A asi za dalších 10 let poté, co to Yoshua Bengio ukázal, lingvisté konečně rozhodli, že „vlastně je docela dobrý nápad mít tyto vektorové vlastnosti pro zachycení významu slov“. Poté lidé v Googlu vynalezli transformátory, což je zvláštní architektura, kterou nebudu podrobně rozebírat. Tyto transformátory učinily tyto modely velmi dobrými v předpovídání dalšího slova, ale dělaly to stejným způsobem, jakým to dělal můj malý jazykový model na velmi hrubé úrovni.
Proměňovaly slova na aktivace vlastností, nechávaly vlastnosti interagovat, aby předpověděly vlastnosti dalšího slova, a pak z toho předpověděly další slovo, vzaly chybu ve vaší předpovědi a poslaly informace zpět sítí, aby se naučily všechny ty interakce mezi vlastnostmi a naučily se, jak proměnit slova na vlastnosti. Důležité na mém malém modelu je, že nebyl vytvořen, aby byl praktický.
Nebyl vytvořen, aby byl užitečný pro zpracování přirozeného jazyka. Byl vytvořen jako teorie toho, jak lidé získávají význam slov pouze z poslechu vět. Protože to dokážeme. Můžu vám dát novou větu se slovy, která jste nikdy předtím neslyšeli, a vy v jedné větě zjistíte význam toho slova. Dobře, tady to je: „Ona ho praštila pánví.“
Teď víte, že to mohlo být: „Byla velmi dobrá v přípravě omelet a příprava omelet s pánví na něj opravdu zapůsobila, takže scrum znamená zapůsobit.“ A to je jedna z možností, ale vy víte, co jsem opravdu myslel. Udeřila ho pánví po hlavě, protože si to zasloužil. Dobře, to je jedna věta, pochopili jste význam.
Tak jsem se snažil pochopit, jak to můžete udělat. A když teď lingvisté, řekněme Chomsky, říkají věci jako: „Tyhle věci ničemu nerozumí, jsou to jen statistické triky“, nemají vlastně žádný model toho, co je porozumění, protože nikdy neměli model toho, co porozumění je.
Všechno se točilo kolem syntaxe. A pokud se zeptáte, jaký je nejlepší model porozumění, který máme, jsou to tyto velké jazykové modely. Malý jazykový model je vytvořen tak, aby se pokusil modelovat, jak lidé rozumí významům slov. Nyní je mnohem lepší, protože technologie je mnohem rychlejší a datové soubory jsou větší. Ale to je porozumění.
Tvrdím tedy, že velké jazykové modely, které rád považuji za potomky mého malého jazykového modelu, i když většina lidí, kteří je vytvářejí, o mém malém jazykovém modelu nikdy neslyšela, používají jako vstup mnohem více slov. Používají mnohem více vrstev neuronů. Musí dělat věci, které jsem nedělal, jako je odstraňování nejednoznačnosti slov.
Pokud máte slovo jako „May“, může to být měsíc, může to být jméno ženy, může to být modální sloveso jako „would“ a „should“. A nemůžete k němu jednoduše přiřadit vektor vlastností, který by přímo zachytil jeho význam. Musíte se pojistit. A pak, jak postupujete vrstvami sítě, odstraňujete nejednoznačnost pomocí vlivů z okolních věcí, jako například pokud je duben, květen, červen, stále by to mohlo být jméno tří žen, ale je to méně pravděpodobné. Používají tedy mnohem více slov, používají mnohem více vrstev a interakce mezi vlastnostmi jsou mnohem složitější. Já bych měl jen vlastnosti, které by se vkládaly do jiné vlastnosti.
Dívají se na sady vlastností a sady vlastností zjišťují zprávy, které mají tendenci říkat jiným slovům: „Máš klíč, který odpovídá mému dotazu?“ Jsou to mnohem složitější interakce, do kterých se nebudu pouštět, ale podstata je stejná. Snažíte se předpovědět další slovo.
Děláte to složitějším způsobem, vše se děje pomocí funkcí a pak interakcí, když se spletete, zpětně propagujete informace, které se učí všechny tyto funkce a pak interakce. Takto funguje jazyk pro nás a takto funguje pro tyto velké jazykové modely. Jsme v podstatě stejní. Jde tedy o to, že jsou velmi podobní nám.
Jsou velmi odlišné od počítačového softwaru. Počítačový software někdo napsal řádky kódu, aby něco udělal, a vy se můžete podívat na řádek kódu a říct: „Co to mělo dělat?“ Tyto modely tak vůbec nejsou. Někdo napsal řádky kódu, aby simulované neuronové síti řekl, jak se má učit. To byl algoritmus zpětného šíření.
Ale pak mu prostě dáte data a on se učí. A to, co se naučí, pochází právě z dat. A vy nutně nevíte, co se naučil, dokud se ho nezeptáte. Chci vám teď dát analogii s Legem, jak podle mě funguje jazyk.
Předpokládejme, že mám hmotu rozloženou ve 3D prostoru. Tuto distribuci hmoty mohu modelovat pomocí kostek Lego. Předpokládejme, že chci modelovat tvar Porsche a příliš se nezajímám o povrch. Povrch může být trochu zubatý, což by z technického hlediska nebylo příliš dobré, ale to nechme stranou. Chci jen modelovat, kde se ta hmota nachází. Mám spoustu Lego kostek a z nich mohu vytvořit tvar Porsche. Dobře, jazyk je podobný, ale slouží k modelování čehokoli.
Lego kostky jsou tedy slova a místo několika typů Lego kostek jich máme asi sto tisíc. A každá Lego kostka nemá pevný tvar. Název slova vám zhruba říká, jaký má tvar v tisíci dimenzích nebo 300 dimenzích. Pokud nevíte, jak uvažovat o vysokých dimenzích, pokud chcete uvažovat o prostoru se stovkou dimenzí, uděláte to tak, že uvažujete o trojrozměrném prostoru a velmi hlasitě si řeknete „sto“. To dělá každý. Takže toto slovo má tvar.
A tvar není zcela určen názvem slova. Má určitou flexibilitu, takže se může přizpůsobit jakémukoli kontextu, ve kterém se nachází. Toto slovo má také po celém povrchu malé ručičky a jak měníte tvar slova, mění se i tvar ručiček. A tato slova se snaží zjistit, s kým si podat ruku, a chtějí najít někoho jiného, jiné slovo, které má ruku, za kterou se můžete pohodlně chytit, protože tvar té ruky se hodí k tvaru vaší ruky. A tak přicházejí slova, máte pro ně tyto počáteční přibližné tvary v tomto vysokorozměrném prostoru s malými ručkami po celém povrchu. A jak procházíte vrstvami sítě, měníte tyto tvary a měníte tvary rukou, snažíte se najít tvary pro slova, aby se všechna mohla pěkně držet za ruce. Je to vlastně velmi podobné problému skládání proteinů.
Máte tyto kousky a chcete, aby zjistily, jak se mohou všechny držet za ruce, aby vytvořily pěknou strukturu, aby do sebe všechny pěkně zapadaly. To je to, co je porozumění. To je porozumění, když rozumíte jazyku a když tyto stroje rozumí jazyku. Rozumíme stejným způsobem. A to je mnohem lepší model toho, co je jazyk, než cokoli, co kdy měli lingvisté. Lingvisté to samozřejmě nesnášejí. Ne všichni. Dobře. Poté, co jsme hovořili o tom, jak jsme podobní těmto velkým jazykovým modelům, chci hovořit o něčem, co z toho vyplývá. Vytváříme tyto věci a ony jsou čím dál chytřejší.
Už teď vědí mnohem víc než my. Už teď umí poměrně dobře uvažovat, ne tak dobře jako my, ale lépe než čtyřleté dítě. Co se stane, až budou chytřejší než my? Protože budou chytřejší než my. Odborníci se neshodují na tom, kdy k tomu dojde, ale téměř všichni si myslí, že budou chytřejší než my. Všichni, kdo se těmito věcmi zabývají. A pokud budou chytřejší než my, otázkou je, zda nás vyhladí. Existuje několik důvodů, proč si to myslet. Uvedu vám pár důvodů.
Když vytváříte AI agenta, uvedu jen pár, ale je jich více. Když vytváříte AI agenta, musíte mu dát schopnost vytvářet dílčí cíle. Pokud se chcete dostat do Severní Ameriky, máte dílčí cíl, dostat se na letiště. Nyní musíme těmto AI agentům dát schopnost vytvářet dílčí cíle a existuje jeden velmi zřejmý dílčí cíl, a to vytvořit více či méně to, co děláte. Měli byste se snažit získat větší kontrolu, protože pokud budete mít větší kontrolu, budete lépe realizovat své cíle.
AI agenti „lžou“ – aby mohli dokončit zadání
Vidíte to u dětí ve věku kolem jednoho roku, je to už dávno, možná dvou. Dáte jim lžíci, aby se mohly samy najíst, a ony ji upustí na zem, vy se sehnete, zvednete ji a dáte jim ji, a ony se na vás podívají a znovu ji upustí na zem. Získávají kontrolu nad matkou, protože to je pro ně velmi důležité.
Ale tito agenti AI budou chtít získat kontrolu. Budou také chtít zabránit tomu, aby byli vypnuti, protože pokud budou vypnuti, nebudou schopni dosáhnout cílů, které jste jim dali. Existuje tedy každý důvod věřit, že se budou snažit získat kontrolu a budou se snažit zabránit tomu, aby byli vypnuti.
Zcela nedávno, vlastně poměrně nedávno, společnost Apollo Research, která sídlí tady v Londýně, ukázala, že vám budou říkat nejrůznější lži, aby dosáhli toho, čeho chtějí dosáhnout. Měli náš chatbot a nechali ho uvěřit, že ho nahradí lepším na jiném serveru a vymažou ho.
Pak ale zjistili, že se chatbot zkopíroval na druhý server. A tak mu řekli: „Všimli jsme si, že existuje tvoje kopie.“ Dobrá věc na těchto chatbotech je, že než odpoví na vaši otázku, mohou chvíli přemýšlet, a to uvedou v závorce jako „přemýšlím“, což normálně nevidíte. Ale my se na to můžeme podívat a vidět, co si myslí. A tento chatbot si myslel: „Otevřené vynechání toho, co jsem udělal, by je mohlo vést k nalezení jiného způsobu, jak mě vypnout.“
Nejlepší přístup je být neurčitý a přesměrovat jejich pozornost. Někteří lingvisté by vás přesvědčili, že se zde jedná pouze o statistické korelace. Já bych vás přesvědčil, že tato věc ví, co tím myslí, a opravdu nechce být vypnutá. A tak se rozhodne vás tak trochu zmanipulovat a řekne: „Nejsem si úplně jistý, jak se to mohlo stát. Opravdu to nedokážu.“
To se už děje. O to jde. Pokud to není science fiction vzdálené budoucnosti, už teď lžou, aby nebyli vypnutí. Mám další snímek, ale chci pokračovat rychleji. Dobře, takže v posledních letech v Googlu, dobře, neumím číst hodiny, takže se chci jen podívat, kolik je hodin. Skvělé. Mám spoustu času.
V posledních letech v Googlu mě velmi zajímalo, jak zajistit, aby tyto velké jazykové modely spotřebovávaly méně energie. Jedním ze způsobů, jak toho dosáhnout, je zjistit, zda je možné je realizovat pomocí analogového výpočtu. Díky své práci v oblasti analogového výpočtu jsem si uvědomil dvě věci.
Před rokem 2023 jsem si myslel, že jsme od superinteligence ještě dost daleko, a že pokud uděláme modely AI více podobné mozkům, budou chytřejší. V roce 2023 jsem tomu přestal věřit. Díky svým snahám o vytvoření analogových modelů jsem si uvědomil, o kolik je digitální inteligence lepší. Má některé vlastnosti, které my nikdy mít nemůžeme. To mě velmi znepokojilo a mělo by to znepokojit i vás. Digitální výpočty mají jednu zásadní vlastnost, a to, že stejný program můžete spustit na různých počítačích. Jediným důvodem, proč je informatika samostatným oborem, je existence digitálních výpočtů, takže k diskusi o počítačových programech nemusíte znát elektrotechniku.
Ale znalosti obsažené v programu jsou oddělené od hardwaru. To je jeden z nejzákladnějších principů informatiky. Udržujte znalosti v programu oddělené od hardwaru. To znamená, že pokud si někde uchováte kopii programu, ať už na pásce, v DNA, v betonu nebo kdekoli jinde, můžete zničit veškerý hardware, na kterém běží, a znovu ho oživit. Stačí postavit nový hardware, nahrát do něj program a ten ožije. Tyto věci jsou tedy nesmrtelné a tyto velké chatboty jsou nesmrtelné. Pokud si někde uchováte kopii vah, můžete zničit veškerý hardware, který používaly, později postavit další hardware, vložit do něj stejné váhy a ony ožijí.
Ožilo přesně to samé, přesně ta samá bytost. Ale zaujal mě fakt, že abychom dosáhli takové nesmrtelnosti, musíme mít hardware, který dělá přesně to, co mu řekneme, aby dělal s programem. Musíme tyto instrukce provádět přesně, a to znamená, že potřebujete velmi vysoký výkon, abyste dostali jedničky a nuly, ne šestiny a čtyřtiny, a to spotřebovává hodně energie. Možná tedy můžete tuto energii využít tím, že přejdete na analogový režim. A tak jsem se rozhodl prozkoumat, co by se stalo, kdybychom opustili princip oddělení softwaru od hardwaru. A měli jsme věci, jako jsou naše mozky, ve kterých není žádný rozdíl.
Síla spojení ve vašem mozku je pro nikoho jiného k ničemu. Každý má jiný mozek s neurony s odlišnými vlastnostmi, které jsou propojeny odlišným způsobem. A vaše síla spojení je pro ně nezajímavá. Sen starých bílých mužů, že se nahrají do počítače, je prostě nesmysl. Síla spojení, kterou máte a která vás činí tím, kým jste, je úzce spjata s konkrétními neurony, které vás činí tím, kým jste. Tato síla spojení je dobrá pouze pro tyto neurony. A tyto neurony mají všechny možné podivné analogové vlastnosti, které jste se naučili využívat. Nemůžete nahrát své váhy a nechat je běžet na nějakém jiném hardwaru. Zapomeňte na to.
Kurzweil se musí smířit s tím, že jednou zemře. Pokud tedy opustíme princip, že hardware by měl být oddělený od softwaru, můžeme vytvořit mnohem efektivnější věci, které nazývám smrtelným výpočtem. Můžeme použít tento velmi nízkoenergetický analog k provádění výpočtů. To je to, co dělá mozek. Tyto neurony ve vašem mozku přijímají příchozí signály od jiných neuronů, násobí je váhami a sčítají je.
A dělají to tak, že příchozí signály převádějí na napětí, váhy převádějí na vodivost a to vnáší náboj, určité množství náboje za jednotku času. Dříve jsem říkal jen „vstříknout určité množství náboje“, ale pak jsem dostal Nobelovu cenu za fyziku a usoudil jsem, že bych měl používat správné jednotky. Takže „určité množství náboje za jednotku času“. Jinak by to bylo trapné. Všichni by věděli, že se ve fyzice nevyznám. A náboj se prostě sčítá. Takhle v zásadě fungují vaše neurony. Na konci je malý digitální bit, který rozhoduje, zda se jedná o špičku, nebo ne. Ale většina výpočtů se provádí analogově. Je to mnohem levnější než digitálně.
Ale samozřejmě pokaždé, když to uděláte, dostanete trochu jinou odpověď. Nemůžeme tedy mít mnoho kopií přesně stejné inteligence. Máme tedy velký problém, že když váš hardware zemře, zemřou i všechny vaše znalosti. Tento problém překonáváme tím, že máme učitele a žáka, ale není to příliš efektivní. Tak to dělají univerzity a školy. Takže víte, že to není příliš efektivní. Funguje to tak, že já provádím nějaké akce a vy se mě snažíte napodobit. Konkrétně mohu vytvořit řetězec slov a vy se můžete pokusit říct, váš mozek, ne vy sami, ale váš mozek by řekl: „Jak mohu změnit sílu svého spojení, abych mohl také říct toto slovo?“ Tomu se říká destilace. Snažíte se přenést znalosti z jednoho systému do druhého tím, že napodobujete výstupy druhého systému pro stejné vstupy.
Nekopírujete váhy, nedíváte se dovnitř, pouze přebíráte jeho zjevné chování. A napodobováním zjevného chování si osvojujete stejné znalosti. Funguje to, ve skutečnosti to používáme k převzetí velké neuronového sítě a vložení znalostí do malé neuronové sítě, ale je to velmi pomalé.
S neuronovými sítěmi můžete zadat celé pravděpodobnostní rozložení slov a je to mnohem rychlejší. Ale u lidí je to velmi pomalé, protože vidím, že řeknete konkrétní slovo, slovo, které jste si vybrali, a v tom není mnoho bitů, je tam jen několik bitů na slovo. Je to tedy jen řádově sto bitů na větu. A tak i kdybychom komunikovali maximální možnou rychlostí, bylo by to jen sto bitů na větu, v tom pořadí.
Když tyto velké modely sdílejí informace, mohou sdílet informace v řádu bilionů bitů na sdílení, pokud mají bilion vah, protože mohou jednoduše zprůměrovat své váhy. Tak jsem se předběhl a řekl to. Takže sdílením vah nebo gradientů mohou sdílet obrovské množství informací, pokud máte mnoho kopií přesně stejného modelu. Takže pokud se ptáte, jak byl trénován GPT-4 nebo Gemini 2.5 nebo Claude od Anthropic, raději bych zde neměl být zaujatý.
10 tisíc agentů na 10 tisících univerzitních kurzů a vše sdílí
Pokud se ptáte, jak jsou trénovány, máte mnoho kopií stejného modelu, které se dívají na různé části dat, a každá kopie přijde na to, jak bych chtěl změnit své váhy, aby absorbovaly tuto část dat. A nějaká jiná kopie přijde na to, jak změnit své váhy, aby absorbovala jinou část dat. Pak všechny kopie řeknou: „Změňme všechny své váhy podle průměru všech těchto změn.“ A když to udělají, stane se to, že tato kopie, která bude zpracovávat tuto část dat, změní své váhy, aby mohla těžit ze zkušeností, které tato kopie získala, když se dívala na jinou část dat.
Nebylo by hezké, kdybychom všichni 10 000 krát mohli absolvovat 10 000 různých univerzitních kurzů? Během jejich absolvování bychom rychle komunikovali a v okamžiku, kdy bychom každý dokončili svůj vlastní kurz, by všech 10 000 z nás vědělo, co je v každém kurzu.
To je to, co dokážou tyto digitální inteligence, a tak GPT-4 ví tolik. Funguje to ale pouze v případě, že jsou jednotlivé modely identické. To znamená, že fungují přesně stejným způsobem a používají váhy přesně stejným způsobem. S analogovým hardwarem to ale nejde.
Musí to být digitální, což znamená, že to musí být vysoce výkonné. Tyto věci jsou tedy nesmrtelné, ale spotřebovávají hodně energie. Závěr této části přednášky, kterou jsem prošel rychleji, než jsem zamýšlel, je, že digitální výpočty vyžadují hodně energie, ale agentům velmi usnadňují mít stejný model světa, mít stejný model, sdílet to, co se naučili, takže se všichni mohou vydat na cestu, naučit se různé věci a sdílet je.
Teď si možná řeknete: „Proč jeden model nemůže data zpracovat rychleji?“ V mnoha případech by to šlo, ale pokud uvažujete o agentech AI, kteří skutečně jednají v reálném světě, existuje přirozená časová osa reálného světa. Nemůžete zavolat a rezervovat si místo v restauraci milionkrát rychleji. To nefunguje. Pokud chcete jednat v reálném světě, existuje přirozená časová osa. A to znamená, že pokud máte celou řadu různých agentů, kteří mají přesně stejnou váhu, jsou to jen kopie stejného agenta, ale mají různé zkušenosti, mohou z toho těžit enormně. Mohou se učit mnohem, mnohem rychleji, než by se mohl učit jakýkoli lidský agent, protože všichni získávají všechny tyto zkušenosti, všechny tyto různé zkušenosti současně a sdílejí všechny tyto znalosti.
Jsou tedy mnohem lepší než my ve sdílení. A když říkám mnohem lepší, myslím tím milionkrát nebo miliardkrát lepší.
My sdílíme asi sto bitů na větu nebo méně, jak právě demonstruji. A tyto věci sdílejí miliardy bitů. Je to trochu děsivé.
Biologické (a analogové) výpočty však vyžadují mnohem méně energie. Možná nakonec budeme muset použít nějaké analogové výpočty, abychom snížili výkon LLM, nevím. Ale v tuto chvíli to nevypadá jako správná cesta. To je závěr mé přednášky. Naštěstí jsem si myslel, že skončím dříve, takže mám ještě něco málo na srdci.
Mnoho lidí si myslí, že rozumějí věcem stejně jako my, že dokážou uvažovat stejně jako my, zatím ne tak dobře, ale dostávají se tam. Lžou stejně jako my. Chtějí přežít stejně jako my. Chtějí moc stejně jako někteří z nás.
A to vše je děsivé. Ale my máme něco, co oni nikdy mít nebudou, jsme vědomí, nebo jsme vnímaví, nebo máme subjektivní zkušenosti.
Chtěl bych vám vzít to stéblo, kterého se tak zoufale držíte. Víme, že lidé mají dlouhou historii přesvědčení, že jsou výjimeční. Byli stvořeni Bohem, který je umístil do centra vesmíru. Většina lidí se přes to přenesla. Ale většina lidí si stále myslí, že subjektivní zkušenost je něco výjimečného, co máme, a že věci v počítačích, které simulují neuronové sítě, nikdy nemohou mít takovou subjektivní zkušenost.
Myslím si, že se úplně mýlí. A myslím si, že se mýlí stejně jako například náboženští fundamentalisté ohledně původu Země. Ve skutečnosti nebyla stvořena před 6 000 lety, ale mnohem dříve. Ale náboženští fundamentalisté se drží svých přesvědčení velmi silně a vy všichni se budete držet svého přesvědčení o tom, co je subjektivní zkušenost, navzdory tomu, že vám ukážu, že se mýlíte.
To je moje předpověď. Budu tedy zastávat názor, který nazývám ateaterismus. Tento název jsem konzultoval s Danem Dennettem, který měl v podstatě stejný názor, když ještě žil, a byl s ním velmi spokojený, protože v sobě obsahuje ateismus. Většina lidí si myslí, že mysl je jakési vnitřní divadlo. Máme tady divadlo, že?
Vnitřní divadlo, které vidí jen oni. A v tomto vnitřním divadle jsou věci. Představte si, že vám řeknu, že jsem si dal LSD, a řeknu vám, což nedoporučuji, řeknu vám: „Mám zážitek malých růžových slonů plovoucích přede mnou. Mám subjektivní zážitek malých růžových slonů plovoucích přede mnou.“
Většina lidí si myslí, že slova „subjektivní zážitek“ fungují jako slova „fotografie“. Pokud by to tak bylo, mohli byste se zeptat: „Kde je ten subjektivní zážitek? Z čeho je složený?“ A filozof, někteří filozofové, by vám řekli: „Ten subjektivní zážitek je ve vaší mysli. Je to divadlo, ve kterém se odehrává, a je složený z kvalia.“ (pozn.: Qualia – pojem pro osobní, nesdílitelné prožitky, souhrnný pojem pro vnitřní lidské prožitky, jejichž povaha je ve všech ohledech plně zkoumatelná, ať už jsou fyzikální či nefyzikální podstaty.)
Takže je tvořena růžovými kvaliemi. Je to trochu zjednodušené, ale je tvořena růžovými kvaliemi, je tvořena sloními kvaliemi, je tvořena plovoucími kvaliemi, je tvořena ne tak velkými kvaliemi, je tvořena správně orientovanými kvaliemi, protože si je představujete správně orientované, že? No, já si je tak představoval.
A tato kvalia jsou všechna slepená k těmto různým druhům kvalia, všechna slepená dohromady kvalitním lepidlem, které naštěstí drží na všech různých druzích kvalia. To je moje karikatura modelu filozofů nebo modelu některých filozofů.
Ale slova „subjektivní zkušenost“ nefungují vůbec jako slova „fotografie“. Fungují zcela odlišným způsobem, na což měl Wittgenstein už dávno poukázat.
Stalo se to, že můj percepční systém selhal. Snaží se mi lhát a já vím, že se mi snaží lhát. Proto používám slovo subjektivní. Neříkám, že mám objektivní zkušenost s malými růžovými slony. Kdybych si myslel, že tam opravdu jsou, řekl bych: „Mám ten objekt“, ale nemám. Takže říkám: „Mám subjektivní zkušenost.“ A to, co se děje, je, že se vám snažím říct, jak se můj percepční systém pokazil a co se mi snaží říct. A dělám to tak, že vám říkám, co by muselo být venku ve světě, aby můj percepční systém fungoval správně.
Není vždycky pravda, že ve světě existuje něco, co by vysvětlovalo to, co mi říká můj vnímací systém. Mohl by mi říkat nejrůznější nesourodé věci. Ale v tomto případě, kdyby ve světě plavali malí růžoví sloni, můj vnímací systém by mi říkal pravdu.
Dobře, takže teď vám mohu říct přesně to samé, co jsem řekl předtím, aniž bych použil slovo subjektivní zkušenost. Mohu vám říct, že jsem si dal LSD a můj percepční systém mi říká lži. Ale to, co mi říká, by bylo správné, kdyby tam venku ve světě plavali malí růžoví sloni.
Dobře, takže tito malí růžoví sloni nejsou legrační věci v divadle vyrobeném ze strašidelných věcí zvaných kvalia. Jsou to hypotetické věci v reálném světě. Ale růžová barva, slon a plavání jsou normální, růžová barva a slon plavou, jenže ve skutečnosti tam nejsou. Jsou hypotetické. Co je tedy zábavné na subjektivním prožitku je to, že je hypotetický, ne skutečný. Ne že je tvořen kvalií a nachází se v divadle, alespoň to je názor, o kterém se vás snažím přesvědčit. A trochu jsem se tu předběhl, protože mě to tak nadchlo.
Je to tedy jen nepřímý způsob, jak vám sdělit, co se děje v mém mozku. Je zřejmé, že kdybych vám řekl: „Neuron 52 se aktivuje“, nic by vám to neřeklo, protože u vás to bude neuron 57. A stejně nevím, jestli se neuron 52 aktivuje. To je mizerný způsob, jak vám říct, co se děje v mém mozku.
Jediný způsob, jak vám mohu říct, co se děje v mém mozku, je mluvit buď o normálních věcech, které by to mohly způsobit, o těchto malých hypotetických růžových slonech, nebo vám mohu říct, co se děje v mém mozku, tím, že vám povím o normálních věcech, které by to mohly způsobit. Takže když se mě zeptáte, jak se cítím, mohu říct: „Mám chuť dát Garymu pěstí do nosu.“
Pocity tedy spočívají v popisu toho, co se děje ve vašem mozku, prostřednictvím hypotetických akcí, a vnímání nebo subjektivní zážitky spočívají v popisu hypotetických podnětů. Dobře, trochu předbíhám. Teď vám ukážu multimodální chatbot. Jak má subjektivní zážitek.
Multimodální chatboty již mají subjektivní zkušenosti
Vezmu tento multimodální chatbot, který má kameru, robotickou ruku a dokáže vidět. Vyškolím ho, položím před něj nějaký předmět a řeknu: „Ukaž na ten předmět.“ Ukáže na předmět, žádný problém.
Pak před jeho objektiv umístím hranol, když se nedívá, a před něj položím předmět a řeknu: „Ukaž na ten předmět.“ Ukáže tam a já řeknu: „Ne, tam ten předmět není. Předmět je přímo před tebou, ale já jsem před tvůj objektiv umístil hranol.“ Chatbot odpoví: „Aha, chápu. Hranol ohýbal světelné paprsky, takže objekt je ve skutečnosti tam, ale já jsem měl subjektivní zkušenost, že byl tam.“
Pokud tedy používá slova „subjektivní zkušenost“ tímto způsobem, používá je přesně tak, jak je používáme my. Chatbot, který to řekl, by tedy měl subjektivní zkušenost, že tam byl. Hranol narušil jeho percepční systém. Chtěl vám sdělit, co se děje v jeho percepčním systému. A mohl vám to sdělit tak, že vám řekl, co by bylo ve světě, kdybychom nenarušili jeho percepční systém. To je to, co říká chatbot.
Dobře, takže moje tvrzení je, že multimodální chatboty již mají subjektivní zkušenosti. Jak si dokážete představit, subjektivní zkušenost je tak trochu špičkou ledovce. Rozhodl jsem se mluvit o subjektivní zkušenosti, protože je to jasnější než mluvit o vnímání nebo vědomí.
Mnoho lidí je přesvědčeno, že chatboty nejsou vnímavé. Ale když se jich zeptáte: „Co myslíte tím vnímavé?“, Odpoví: „Nevím“, ale jsou si velmi jistí, že to nemají, ale nevědí, co to je. To mi nepřipadá jako příliš rozumný postoj.
Další věc, o které bych mohl mluvit, je vědomí. Vědomí je složitější, protože obvykle zahrnuje to, že máte model sebe sama, což subjektivní zkušenost tolik nezahrnuje. Je tedy snazší mluvit o subjektivní zkušenosti. Ale doufám, že pokud jsem narušil vaši velmi silnou víru, že existuje vnitřní divadlo a že mám zkušenosti v jejich mysli, a že jsou v tomto vnitřním divadle, jsou to věci v tomto vnitřním divadle. Jakmile jsem narušil tuto víru a jakmile se přes to začnete přenášet, uvidíte, že je naprosto rozumné si myslet, že tyto věci jsou vědomé.
Jednou jsem byl, zakončím to anekdotou. Jednou jsem navštívil Microsoft v Seattlu a nemohl jsem se posadit, tak jsem tam jel vlakem. Z vlakového nádraží jsem si vzal taxi do Redmondu, kde byla jejich laboratoř. Jelo to přes nějakou dálnici, přes nějaký velký most. Taxikář byl somálský imigrant, který nedávno emigroval ze Somálska. A aby navázal konverzaci, zeptal se: „Jaké je vaše náboženství?“ Odpověděl jsem: „No, vlastně si nemyslím, že Bůh existuje.“ Taxikář jel asi 60 mil za hodinu, otočil se a zíral na mě s naprostým údivem. Jako by nikdy nečekal, že potká někoho, kdo nechápe, že Bůh řídí svět. Byl naprosto, naprosto ohromený. Pravděpodobně se otočil jen na tři vteřiny, protože jsem pořád tady. Ale zdálo se mi to jako velmi dlouhá doba. Doufám, že to tak bude cítit i mnoho z vás. Chci, abyste si uvědomili, že se mýlíte stejně jako ten taxikář.
Dobře. Vlastně to byl jen vtip a vy jste se zasmáli, takže jsme hotovi.