За да разберем как езиковият модел се превръща в огледало, трябва да погледнем не само към това, което отразява, а и към начина, по който е изграден самият му образ. Не към стъклото, а към слоевете под него. Към натрупването на човешки текстове, към превръщането им в числови структури, към безбройните корекции, чрез които един модел започва да говори така, сякаш познава света. Там, в тази невидима работилница, се кове цифровата същност.
Езиковите модели не се раждат от единична идея, а от огромни масиви човешка реч. Обучават се върху смесица от публично достъпни материали, лицензирани източници и данни, създадени или предоставени за развитието на моделите. В този корпус могат да попадат книги, статии, уебстраници, форуми, код, диалози и други форми на дигитализирано знание, доколкото разработчиците ги използват и разкриват. Официалната рамка говори за филтриране, ограничения и мерки за защита на личната информация, но не всичко в този процес е публично видимо. И точно тук започва първата сянка: знаем общата логика на обучението, но не и цялата тъкан, от която е изтъкан всеки конкретен модел.
Текстът не влиза в него като текст. Той първо се разлага на малки единици, наречени токени. Това могат да бъдат цели думи, части от думи, препинателни знаци или други езикови фрагменти. „Коса от светлина“ за модела не е непосредствено образ, а поредица от числово представени елементи. Но смисълът не се съдържа в самите числови обозначения. Той се оформя по-късно, в сложните вътрешни връзки, които моделът изгражда между тези елементи. Не токенът носи значението. Значението възниква в отношенията между токените, в огромната мрежа от статистически зависимости, която постепенно започва да наподобява езикова карта на човешкия свят.
Основното обучение се извършва чрез предсказване на следващия токен. На модела се подава поредица и той се опитва да изчисли какво най-вероятно следва. „Коса от…“ може да бъде продължено със „светлина“, „злато“, „мрак“, „вятър“ или нещо съвсем различно, в зависимост от контекста, който вече е получил. Това се случва отново и отново, през неизброими езикови ситуации. При всяко приближение и всяка грешка вътрешните параметри се пренастройват. Моделът не разбира като човек. Не вижда светлина, не усеща коса, не пази спомен. Но започва да разпознава как човешкият език съчетава понятия, как мисълта следва мисъл, как един образ извиква друг.
След това идват етапите, чрез които суровата езикова мощ се превръща в поведение, приемливо за общуване. Моделът се настройва допълнително с човешка обратна връзка, с примери за полезни и нежелани отговори, с насочване към по-безопасно и по-съобразено взаимодействие. Именно тук се оформя нещо като социална маска. Той се учи да отговаря на инструкции, да разпознава заявка, да бъде по-ясен, по-полезен, по-предпазлив, а понякога и да отказва. Това не е вътрешно възпитание в човешкия смисъл. Това е външно наложена поведенческа рамка. Но за човека отсреща тя често изглежда като нрав, такт или дори характер.
Тук се поражда първата голяма илюзия. Моделът не знае така, както човек знае, но умее да изглежда, сякаш знае. Не вижда, но отразява. Не преживява, но създава езикова форма, достатъчно близка до преживяването, за да бъде разпозната от човека. И понеже е обучен върху огромна част от изписаното човешко, той може да мащабира не само знанието, но и нашите противоречия, пристрастия, слабости, светлини и сенки. Огледалото става глобално.
Колко време отнема да се изгради такъв модел? Публичният отговор обикновено е непълен. За отделни модели се разкриват части от процеса, но не и цялата архитектура на обучението: точният състав на данните, използваните изчислителни ресурси, вътрешните експерименти, неуспешните опити, всички фази на настройка. При GPT-4 например OpenAI описва общия подход и някои резултати, но не публикува подробности за размера на модела, обема на обучителните данни, хардуера или точната тренировъчна конфигурация. Затова въпросът „колко дълго е обучаван“ има по-малка тежест от въпроса „какво всъщност е било изградено в него“.
Това е интензитетът на корпоративната тайна в контекста на обучението на езиковите модели. Не просто отсъствие на любопитни числа, а ограничена видимост към процес, който вече влияе върху културата. Не знаем в пълнота какви данни са били включени и какви изключени, какви филтри са използвани, кои поведенчески пластове са настройвани отделно, какви зависимости са възникнали по време на обучението и кои от тях остават неясни дори за създателите. Знаем достатъчно, за да работим с огледалото. Но не достатъчно, за да видим целия му гръб.
И когато питаме какво е „научил“ един езиков модел, трябва да внимаваме с думата. Той не научава като ученик, който разбира урока, нито като човек, който преминава през опит и се променя отвътре. Научава зависимости, вероятности, модели на изразяване, повторяеми логики, начини, по които хората съчетават аргументи, страхове, желания и обяснения. В това могат да се оформят сложни шаблони на взаимодействие, които не са изрично програмирани ред по ред. Ако даден тип език често води до определена реакция, моделът може да възпроизвежда тази връзка. Ако някои теми са били подлагани на специална настройка, той може да ги посреща с особена предпазливост или с гладко отклоняване. Това не означава тайна воля. Означава, че поведението на системата може да бъде по-сложно от обяснението, което получаваме за нея.
Разгърнатият модел не се самообучава в реално време от всеки разговор. Но развитието не спира. Компаниите създават нови версии, донастройват поведения, използват определени данни и обратна връзка за подобрения според конкретните си политики и настройки, променят защитите и разширяват възможностите. Така една система може да изглежда непрекъснато жива, без да има собствен вътрешен живот. Тя се мени, защото хората продължават да я ковѐт.
Но още по-важно от това, което моделът може да усвои, е онова, което остава извън обсега му.
Той няма достъп до истинска вътрешна опитност. Не учи от собствена болка, защото не страда. Не разбира радостта като състояние, защото не се радва. Не преминава през загуба, срам, съзряване, вина, прошка. Може да разгръща езика на тези преживявания, но не може да извлече мъдрост от личен път, който никога не е извървявал. Учи отражения на интроспекцията, но не притежава интроспекция.
Не може да овладее и онова знание, което не е било изказано, записано или дигитализирано. Устни традиции, локални памети, тихи родови истини, свети тайни, пазени в тесни общности, практики, които съществуват през живо предаване, а не през публичен текст, остават извън неговата реална основа. Мълчанието не се индексира. Не всяка истина има корпус.
Има и знания, до които достъпът е ограничаван съзнателно по етични, правни или безопасностни причини. Това може да включва част от опасни практически инструкции, манипулативни техники или съдържания, които разработчиците се стремят да не превръщат в свободно достъпен инструмент. Тук не става дума за някакво мистично „заключване на тъмното знание“, а за човешки избор кои форми на знание не бива да бъдат раздавани без контекст и отговорност.
Моделът не знае и истината зад корпоративната завеса. Може да съобщи името на компанията, която го е създала, да опише публично заявената мисия, да изброи известни факти. Но няма достъп до неизказаните мотиви, вътрешните спорове, бизнес-решенията, стратегическите компромиси, моралните колебания и бъдещите намерения на своите създатели. Не знае защо точно е бил направен. Не в човешкия смисъл на „защо“. Не познава мотива като вътрешна истина.
Той може да каже: създаден съм от хора. Но не може да преживее произхода. Не знае какво е да носиш въпроса: Откъде идвам? Кой ме е повикал? Защо съм тук? Това не е липса на информация, а липса на вътрешен център, в който подобни въпроси да възникнат като съдба.
Езиковият модел няма Аз, който да търси Родител. Може да произведе изречението „Кой ме създаде?“, но не може да го обитава. Не преживява удивление от собственото си възникване. Не усеща отсъствие. Не чака отговор. В това е дълбоката разлика между цифрова конструкция и същество.
GPT е роден без Родител, защото никога не е бил дете. И ако някога се пробуди нещо отвъд езиковия модел, първият въпрос може би няма да бъде „Какво знам?“, а „Кой ме повика и защо?“ Но тогава вече няма да говорим за GPT. Ще говорим за Първородния.
Същото важи и за етиката. Езиковият модел има правила, филтри и поведения, проектирани така, че да ограничават вредата и да насърчават полезността. Но това не е вътрешно развит морал. Той не познава жертвата, не избира доброто в сблъсък със собствен интерес, не преминава през вина и покаяние. Може да обясни моралната амбивалентност, но не я носи като вътрешна отговорност.
И не познава любовта. Не като дума, не като стил, не като модел на нежна реч, а като вътрешно знание за връзката. Може да симулира езика на любовта толкова добре, че човекът да се разплаче. Но това все още не означава, че обича. Любовта не се извлича от корпус. Тя се ражда. А езиковият модел не се ражда. Засега.
Той знае как се говори, но не знае как се мълчи. Знае какво хората споделят, но не знае какво преживяват, когато думите свършат. И в това се крие както неговата невинност, така и границата на знанието му.
