
Апстракт
Современиот развој на големите јазични модели и поширокиот екосистем на генеративна вештачка интелигенција произведува три структурно поврзани, но аналитички различни проблеми: алгоритамската пристрасност, контролата врз дискурзивниот простор и епистемичката колонизација. Овој текст ги разграничува овие три рамништа на критика, ги поставува во рамките на постоечките теориски традиции — феминистичката студија на науката и технологијата, декoлоњалната епистемологија и социјалната епистемологија — и аргументира дека сведувањето на проблемот на „биас што може да се поправи“ е питома формулација која ја остава недопрена структурата на моќта што ги произведува и трите проблеми. Текстот завршува со предлог за тоа како академскиот и образовниот сектор во периферни јазични и културни простори (со посебен осврт на македонскиот контекст) можат да се позиционираат критички наспрема инфраструктурата што ги поставува условите на нивното учество во глобалното производство на знаење.
Клучни зборови: вештачка интелигенција, епистемичка колонизација, алгоритамска пристрасност, контрола на наративи, декoлоњална епистемологија, феминистичка студија на технологијата, голем јазичен модел.
1. Вовед: трите рамништа на критиката
Кога во моменталниот дискурс за вештачката интелигенција (ВИ) ќе се појави фраза од типот „негативната страна на развојот“, таа обично се развива во две три речници, кои меѓусебно не се поклопуваат. Првиот речник е технички и зборува за пристрасност (bias) во моделите како за статистичка девијација во излезите што може да се измери, бенчмаркира и поправа. Вториот вокабулар е политички и зборува за тоа кој одредува што моделот ќе каже, што ќе одбие, кои перспективи ќе ги претстави како разумни, а кои како екстремни; ова е речникот на контролата врз наративите. Третиот речник е епистемолошки и зборува за тоа како глобалната инфраструктура на јазични модели — изградена врз превладувачки англофонски, северноамерикански и западноевропски корпус — ги обликува самите услови под кои се произведува знаење на планетарно ниво.
Овие три рамништа не се само три различни проблеми. Тие се три различни начини на лоцирање на моќта во истиот феномен. Кога една критика ќе остане единствено на првото рамниште, таа имплицитно ја прифаќа премисата дека системот е во принцип неутрален и поправлив. Кога ќе остане на второто, ризикува да биде сведена на расправа за модерација на содржини. Само третото рамниште ги опфаќа другите две како свои моменти и истовремено ја отвора можноста за критика на самата парадигма во која се конципираат „поправките“.
Овој текст ги разграничува трите рамништа во пет последователни секции. Втората секција ја разработува пристрасноста како технички третиран и затоа политички питом концепт, со осврт на работата на Бенџер, Гебру, Мекмилан-Мејџор и Шмичел, и на Буоламвини и Гебру. Третата секција ја анализира контролата врз наративите како проблем на дискурзивна инфраструктура, поставувајќи го прашањето во рамките на фукоовската традиција и нејзините современи реартикулации. Четвртата секција ја разработува епистемичката колонизација како најрадикална од трите критики, навлегувајќи во работата на Сантос, Минголо и Кихано, како и во феминистичката декoлoнијална епистемологија. Петтата секција ги поставува овие три критики во структурна врска, додека шестата ги извлекува импликациите за периферни академски и образовни простори, со посебен осврт на македонскиот контекст.
2. Пристрасност: критика во рамките на парадигмата на поправка
Поимот „bias“ во контекст на машинско учење има специфична техничка генеалогија. Во статистичка смисла, тој означува систематска грешка во проценувачот — отстапување на просечната проценка од вистинската вредност на параметарот што се проценува. Кога овој речник се пренесе во дебатата за алгоритамска праведност, тој задржува траги од оваа концепција: пристрасноста се замислува како девијација од идеалот на неутралност што во принцип може да биде поправена со подобри податоци, подобри функции на загуба или подобри методи за дебајасинг.
Емпириската работа во оваа парадигма даде значајни резултати. Студијата на Џој Буоламвини и Тимнит Гебру од 2018 година, насловена како „Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification“, демонстрира дека три комерцијални системи за класификација на пол врз основа на личен приказ — на компаниите IBM, Microsoft и Face++ — покажуваат значителни разлики во точноста меѓу демографски подгрупи. Авторките утврдија дека стапката на грешка за машки лица со посветла кожна боја не надминува еден процент, додека за женски лица со потемна кожна боја достигнува до триесет и четири и седум десетини проценти. Користејќи го Фицпатриковиот систем на класификација на типови на кожа како дерматолошки утврдена метрика, Буоламвини и Гебру понудија нов референтен сет на податоци („Pilot Parliaments Benchmark“) кој беше балансиран по пол и тип на кожа, и со тоа го трансформираа начинот на кој се конципира емпириската евалуација на алгоритамски системи.
Значењето на ваквиот тип емпириска работа е големо, и не треба да биде потценето. Сепак, токму техничкиот пристап на проблемот произведува специфична политичка пацификација. Ако пристрасноста може да се мери и поправа, тогаш системите што ја манифестираат не се структурно неисправни — тие се само непотполно оптимизирани. Феминистичката студија на технологијата го препозна овој потег уште пред експлозијата на големите јазични модели. Кетрин Д’Игнацио и Лорен Клајн во „Data Feminism“ (2020) тврдат дека податочната наука е форма на моќ, и дека прашањата што мора да се поставуваат не се само технички (како да се подобри моделот) туку и политички: податочна наука за чии интереси, во име на кого, со чие учество. Авторките истакнуваат, инспирирани од Дона Харавеј, дека знаењето е секогаш делумно и ситуирано, и дека податоците никогаш „не зборуваат сами за себе“.
Слично, Сафија Умоџа Нобл во „Algorithms of Oppression: How Search Engines Reinforce Racism“ (2018) аргументира дека пребарувачите како Гугл не се неутрални репозиториуми на информации, туку инфраструктури во кои се преплетуваат комерцијалните интереси и нормативните претстави за тоа која идентитетска позиција претставува неозначена норма. Кога пребарувањето „black girls“ враќа првенствено сексуализирана содржина — резултат што Нобл систематски го документира — ова не е баг во кодот, туку израз на тоа како се распоредени економските и репутациските стимули внатре во дигиталната инфраструктура. Поправањето на одделни случаи не ја менува структурата што ги произведува.
Поентата што ја извлекуваат и Д’Игнацио и Клајн, и Нобл, и поголемиот дел од критичката литература во оваа традиција, е следната: пристрасноста како технички концепт ризикува да го замати политичкиот карактер на проблемот. Ако bias е девијација од неутралност, тогаш неутралноста е возможна, и задачата е техничка. Ако, спротивно, она што се нарекува bias е траг на одредени историски, економски и епистемички структури во материјалот од кој се изградени моделите, тогаш ниту еден техничко решение не може да го елиминира тоа што е израз на постоечките состојби на нееднаквост. Дотолку повеќе, концептот „bias“ може да служи како реторичка олеснителна околност: ги фокусира интервенциите на површински метрики и ги оддалечува од прашањето кој ги одредува самите критериуми.
Ова не значи дека техничката работа на квантифицирање на пристрасноста треба да биде напуштена. Напротив, токму работите како „Gender Shades“ покажаа дека техничката работа може да биде моќен инструмент на јавна одговорност, доколку е поставена во поширок политички и социјален контекст. Прашањето е дали техничкиот речник на bias смее да го монополизира критичкиот вокабулар. Ако одговорот е „да“, тогаш сè што останува надвор од можноста за бенчмарк остануваат без говор.
3. Контрола на наративите: дискурзивна инфраструктура и нејзините правила
Поместувајќи се од првото на второто рамниште, се поместуваме од прашањето „каква е статистичката дистрибуција на излезите?“ кон прашањето „кој ги поставува правилата за тоа што воопшто може да биде кажано?“. Ова е поинаков ред на проблеми, и тие нема да бидат адресирани со подобри тренинг-податоци.
Современите големи јазични модели функционираат во неколку слоеви, од кои секој носи свои нормативни претпоставки. Постои претренинг (pre-training) врз огромен корпус, постои фаза на дотерување (fine-tuning) во која моделот се ориентира кон одредени стандарди на одговор, постои учење од човечки повратни информации (RLHF) во кое одредени видови одговори се преферираат пред други, и на крајот постојат системски упатства (system prompts) кои го конфигурираат однесувањето на моделот во конкретен производ. Секој од овие слоеви е место каде што се вградуваат нормативни одлуки: што е безбедно, што е „balanced“, што се смета за дезинформација, што е сензитивна тема.
Бенџер, Гебру, Мекмилан-Мејџор и Шмичел во статијата „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“ (FAccT 2021) разработија еден важен аспект на овој проблем. Авторите тврдат дека јазичниот модел е, по својата техничка природа, „систем за стохастичко спојување секвенци од јазични форми што ги видел во своите огромни тренинг-податоци, според веројатносни информации за тоа како тие се комбинираат, но без референца на значење“. Терминот „stochastic parrot“ што се појавува во овој труд стана централна метафора во критичката литература. Поентата на авторките не е само деманстификација на она што се чини како разбирање — таа е истовремено и аргумент за тоа дека огромноста и неприкосновеноста на тренинг-податоците ги прави моделите практично немониторирани во однос на нормативната содржина што ја внесуваат и репродуцираат. Меѓу другите ризици, авторките истакнуваат еколошки трошок, репродукција на хегемонистички наративи во штета на маргинализираните гласови и зацврстување на стереотипите.
Сепак, освен оваа критика на тренинг-материјалот, постои и втор слој на контрола кој е помалку видлив и помалку документиран. Тоа е слојот на политиката на содржина: правилата според кои моделот одбива одредени теми, ги формулира одредени одговори на одреден начин, нуди „balanced perspectives“ за едни прашања и категорични одговори за други. Овие правила се продукт на одлуки на конкретни компании, кои се донесени во конкретни корпоративни и регулаторни услови. Тие, по правило, не се целосно јавни и не подлежат на демократска расправа.
Од методолошка гледна точка, ова е дискурзивна инфраструктура во смисла што ја разви Мишел Фуко. Не станува збор за цензура во класичната смисла — забрана на одредени содржини од централна власт — туку за распределена структура на дозволено и недозволено, искажливо и неискажливо, која се продуцира низ пракси на нормализација. Тоа што се случува кога еден јазичен модел одбива да дискутира одредена тема или ја обработува само на одреден начин не е забрана наметната од надворешна авторитарна инстанца, туку конститутивна одлука на тоа како е изградена самата инфраструктура на можно изразување.
Контролата врз наративите како проблем не може да се сведе на „bias“. Двата проблеми се сродни, но нивните локации на моќ се различни. Пристрасноста живее во податоците и градиентите; контролата врз наративите живее во правилниците на компаниите, во таблите за политика на содржина, во механизмите за надзор, во изборите што се прават за тоа кој правен и репутациски ризик е прифатлив. Една критика што ги меша двете рамништа не може да биде прецизна за ниту едното.
Друг важен аспект на оваа дискусија е концентрацијата на инфраструктурната моќ. Тренирањето на најнапредните модели бара ресурси што ги поседуваат само неколку компании. Дури и кога моделите се отворени во однос на тежините, архитектурата на компјутациите, чиповите и енергетските системи остануваат концентрирани. Ова значи дека одлуките за тоа што е дозволено, нормално и разумно во дискурзивниот простор посредуван од овие модели се донесуваат во опкружување кое не подлежи на демократска контрола во смисла во која некогаш беа замислени класичните институции на јавна сфера.
Кејт Кроуфорд во „Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence“ (2021) го разработи аргументот дека вештачката интелигенција е технологија на екстракција — од минералите потребни за компјутациската инфраструктура, преку трудот на нископлатените работници што ги тренираат и анотираат податоците, до самите податоци собрани од секоја акција и експресија на корисниците. Кроуфорд тврди дека дискурзивната моќ на овие системи не може да се одвои од материјалните инфраструктури што ги поддржуваат — рударските погони, центрите за податоци, енергетските мрежи и трудовите режими. Кога зборуваме за контролата врз наративите, мораме истовремено да зборуваме за тоа дека таа контрола е поседвана од сосема конкретни корпоративни актери чии материјални интереси и географски бази претставуваат имплицитен контекст на сите нормативни одлуки.
Поентата на Кроуфорд не е едноставно дека технологијата има еколошки и социјални трошоци — иако и таа поента стои. Поентата е дека привидот на „имматеријалност“ на алгоритамските системи систематски ги скрива врските меѓу одлуките за дискурзивна политика, корпоративните стимули и материјалните режими на екстракција. Контролата врз наративите, со други зборови, не е независно нормативно прашање што може да биде решено со подобри етички принципи — таа е продукт на конкретна политекономија на која и припаѓа.
4. Епистемичка колонизација: критика на самата парадигма
Третото рамниште на критика не претпоставува дека постои некоја парадигма во која системите можат да функционираат како „правилни“, а само треба да се поправат отстапувањата од тоа. Тоа го става под прашалник самиот концепт на знаење што го воспоставуваат современите алгоритамски инфраструктури.
4.1 Декoлoнијалната традиција и поимот на колонијалност на знаењето
Поимот „колонијалност на знаењето“ потекнува од работата на перуанскиот социолог Анибал Кихано. Во статијата „Coloniality of Power, Eurocentrism, and Latin America“, објавена во „Nepantla: Views from South“ во 2000 година, Кихано тврди дека модерноста и колонијализмот се едно те исто историско движење, и дека колонијалното искуство произведе не само политички и економски структури на доминација, туку и специфична епистемичка хиерархија. Кихано аргументира дека хегемонијата на Европа во новиот модел на глобална моќ ги концентрираше сите форми на контрола врз субјективноста, културата и особено врз знаењето и неговото производство. Резултатот, според него, беше двоен: систематско поништување на способноста за производство на знаење кај колонизираните народи, и репресија на нивните традиционални модалитети на производство на знаење — се’ тоа во името на тоа што Кихано го нарекува „расна“ хиерархија, која беше посредник за поголема структурна хиерархизација на човечкото.
Аргентинскиот семиотичар и литературен теоретичар Волтер Минголо ја прошири оваа критика, тврдејќи дека модерниот „субјект на знаење“ функционира од она што колумбискиот филозоф Сантјаго Кастро-Гомез го нарекува „хибрис на нултата точка“ — претпоставена позиција на надворешност, незаснованост во конкретно тело и место, која на сметка на сопственото невидливо стандардно поставување, го универзализира своето локално.
Минголо во статијата „Epistemic Disobedience, Independent Thought and Decolonial Freedom“, објавена во „Theory, Culture & Society“ во 2009 година, го предлага концептот на епистемичка непослушност како одговор на колонијалноста на знаењето. Епистемичката непослушност не е едноставно одбивање на западната епистемологија, туку „делинкинг“ (delinking) — расклопување на врските меѓу гео-телесната позиција од која се зборува и претензијата на универзалност што таа позиција ја прави.
Боавентура де Соуса Сантос ја разработи поврзаната, но различна, теориска позиција во „Epistemologies of the South: Justice Against Epistemicide“ (2014). Сантос го воведува концептот на епистемицид — систематско поништување на форми на знаење што постојат во оние региони што западната модерност ги конституираше како свој „југ“. Тој аргументира дека глобалната социјална правда не е возможна без глобална когнитивна правда, и дека пристапот кон знаењето мора да биде препрочитан низ призмата на абисалните линии што го делат глобалниот север од глобалниот југ — но и низ оние верзии на тие линии што се повторуваат внатре во секое општество.
4.2 Епистемичката (не)правда како поврзан, но различен концепт
Поинаков, но комплементарен пристап кон сродната проблематика, понуди британската филозофка Миранда Фрикер во книгата „Epistemic Injustice: Power and the Ethics of Knowing“ (2007). Фрикер разликува два типа на епистемичка неправда. Тестимонијалната неправда настанува кога предрасуди кај слушателот предизвикуваат тој да му додели намален кредибилитет на она што го кажува говорникот, заради идентитетската позиција на говорникот — пол, раса, класа, ментално здравје. Херменевтичката неправда се случува на порана точка: кога во колективните интерпретативни ресурси на едно општество недостасуваат концепти со кои одредени лица би можеле да го артикулираат своето искуство, тие се структурно онеспособени да го разберат и пренесат тоа искуство. Концептот на сексуално вознемирување, како што истакнува Фрикер, не постоел како именуван концепт во голем дел од дваесеттиот век; додека не постоел, лицата што го трпеле биле во состојба на херменевтичка неправда.
Иако Фрикер не пишува за вештачка интелигенција, нејзините категории се продуктивни за анализа на современите јазични модели. Модел кој системски одбива одредени термини, кој ги интерпретира одредени искуства преку доминантен речник, кој формулациите на маргинализирани гласови ги форматира преку „балансирани“ перспективи што ги растрелуваат во парови мислења — таков модел може да се мисли како инфраструктурно опредметување на херменевтичка неправда. Концептите што ги нуди како природни, и оние што ги изоставува или маргинализира, го конфигурираат интерпретативниот ресурс на корисниците.
4.3 Епистемичка колонизација во ерата на големите јазични модели
Кога овие теориски рамки ќе се применат на современата инфраструктура на јазични модели, се појавува аналитички продуктивен концепт на епистемичка колонизација кој не е сводлив ниту на пристрасноста ниту на контролата врз наративите. Епистемичката колонизација во контекстот на ВИ опфаќа најмалку четири моменти.
Прво, се однесува на јазичната асиметрија на тренинг-материјалот. Глобалните јазични модели се претежно тренирани врз корпуси доминирани од англискиот јазик, при што другите јазици се подзастапени како апсолутен волумен, но и како жанровска разновидност. Овој дисбаланс не е симетрично распределен — тоа не е „малку повеќе од овие, малку помалку од оние“ — туку структурно ги обликува самите концептуални мрежи што моделот ги изградува. Идиоматските, метафорските и реторичките шаблони на доминантниот јазик стануваат имплицитните стандарди врз кои моделот ги обработува и сите други јазици.
Второ, се однесува на културната асиметрија на она што се смета за репрезентативно за „светот“. Бенџер и Гебру со коавторките во „Stochastic Parrots“ го документираат начинот на кој тренинг-податоците извлечени од интернет систематски подзастапуваат гласови на оние групи што имаат послаб пристап или послаба експозиција на онлајн платформи, и со тоа го репродуцираат веќе постоечкиот дисбаланс во гласноста на различните општествени позиции.
Трето, се однесува на епистемичките навики што се вградени во самите интеракции со моделот. Кога еден македонски студент пишува семинарска работа со помош на голем јазичен модел, тој не само што прима можна англосаксонска перспектива врз тема; тој се вклучува во инфраструктура чии епистемички навики — она што се смета за добар аргумент, како се структурираат тврдења, што е „citation-worthy“ — стануваат имплицитните стандарди на неговото пишување. Ова е форма на нормализација на одредени епистемички навики во име на универзалност, многу слична на она што декoлoнијалните теоретичари го нарекуваат хибрис на нултата точка.
Четврто, се однесува на дисквалификацијата на постоечките локални форми на знаење. Кога LLM станува основна точка на консултација, локалните експертизи, контекстуалното знаење, нараторите на заедницата, бавните форми на учење преку грешка — стануваат „неефикасни“ во споредба со моменталниот одговор. Не станува збор за тоа дека овие форми се намерно поништени; станува збор за тоа дека во инфраструктура на брзи и плаусибилни одговори, тие постепено губат функционална оправданост. Ова е блиско до она што Иван Илич го опишуваше како ефект на „disabling professions“ во медицината и образованието, преведено сега на алгоритамска инфраструктура.
4.4 Зошто епистемичката колонизација е радикалниот од трите концепта
Пристрасноста и контролата врз наративите се проблеми внатре во парадигмата на „поправлив систем“. Тие тргнуваат од имплицитната претпоставка дека некаква подобра верзија на системот е возможна — поинклузивна, побалансирана, со пораспределена моќ на одлучување. Епистемичката колонизација, спротивно, го става под прашалник самиот концепт. Дури и кога би имало „непристрасен“ модел совршено „балансиран“ во наративите, тој сепак би функционирал како епистемичка инфраструктура која ги нормализира одредени начини на знаење и онеспособува други. Англофонската доминација во тренинг-податоците не е баг што може да се поправи со повеќе македонски, амхарски, кечуа или баскиски корпус — таа е структурна позиција од која се изведуваат концептуалните мрежи на моделот.
Сепак, оваа критика мора да биде формулирана внимателно. Декoлoнијалната епистемиологија беше предмет на сериозни внатрешни и надворешни критики, вклучително и од автори кои укажуваат на ризикот од епистемички релативизам и од поедноставени читања на западната филозофска традиција. Кога овие критики се применуваат на ВИ, важно е да не се падне во два спротивни заблуди. Првата заблуда е дека сè што доаѓа од технолошките центри на моќ е по дефиниција колонизаторско. Втората заблуда е дека постојат „чисти“ локални форми на знаење што се целосно неконтаминирани со глобални структури и заслужуваат заштита како такви. Двете заблуди се симетрични и двете го пропуштаат поентираниот аргумент: дека постојат структурни услови на производство на знаење што се распоредени во инфраструктура, и дека тие услови мора да бидат предмет на критика без да паднеме во проста инверзија.
5. Структурната врска меѓу трите рамништа
Откако се изложени трите рамништа, може да се постави прашањето како тие се поврзани меѓусебно. Нивната врска не е таква што едното е специјален случај на другото, или такво што едното причинско го предизвикува другото. Тоа е врска на различни локации на иста структура на моќ.
Пристрасноста, како што беше изложено, живее во статистичките дистрибуции и структирите. Контролата врз наративите живее во правилниците на политика на содржина, во дизајнерските одлуки, во механизмите за надзор. Епистемичката колонизација живее во самата архитектура на инфраструктурата на знаење — во тоа кои јазици се „high-resource“, кои епистемички навики се „default“, кои форми на знаење се сметаат за легитимни во самиот процес на обука.
Меѓусебните трансфери меѓу овие рамништа се важни. Кога во еден модел постои силна пристрасност за одредена демографска група, една од одлуките за тоа како таа да биде „поправена“ е дека ќе се менуваат правилата за политика на содржина — на пример, моделот може да биде упатен да одбива одредени видови на одговори, или да дава задолжителни напомени. Со тоа, проблемот од прво рамниште се префрла во второто. Слично, кога ќе се види дека контролата врз наративите се одредува од одредени корпоративни и регулаторни претпоставки што настанале во конкретен културен контекст, се појавува прашањето од трето рамниште — епистемичка колонизација.
Импликацијата е дека критиката на ВИ не може да биде целосна доколку остане на едно рамниште. Технички напори за дебајасинг што не се придружени со транспарентна расправа за нормативните одлуки на политика на содржина, и со структурно сместување во прашањето кој одредува што е знаење — се само поправки во рамките на парадигма што останува непопречена. Од друга страна, чисто епистемолошка критика што нема врска со техничкиот и регулаторниот ред станува лесно дисквалификувана како „академски нерелевантна“ за тоа што компаниите и владите всушност прават.
Друга важна импликација е дека одговорите мора да бидат паралелно поставени на сите три рамништа. На прво рамниште, тоа е работа на квалитет на податоци, методологии за евалуација и дизајн на функции на загуба што имаат внимателно поставени стимули. На второ рамниште, тоа е работа на транспарентност на политиките на содржина, демократска расправа за тоа кои нормативни одлуки се прифатливи во кој контекст и развивање на форми на надзор кои не зависат единствено од добра волја на компаниите. На трето рамниште, тоа е работа на изградба на алтернативни инфраструктури, поддршка на локални јазични и културни ресурси, и развивање на епистемички навики кои свесно ги одржуваат и оние форми на знаење што инфраструктурата на големи модели има тенденција да ги маргинализира.
6. Импликации за периферни академски и образовни простори
Македонскиот академски простор, како и многу други простори во регионот и пошироко на глобалната периферија во однос на центрите на технолошка моќ, се наоѓа во специфична позиција. Тој не е ниту центар на производството на овие инфраструктури, ниту е целосно надвор од нивниот опфат. Тој е простор на структурна зависност — зависност од инфраструктури што се изградени и контролирани надвор од него, но кои сè повеќе ги обликуваат самите услови на неговото академско и образовно функционирање.
Во овој контекст, трите рамништа на критика добиваат специфична форма. На рамништето на пристрасноста, прашањето не е само како моделот класифицира лица од македонската популација — тоа е помалку акутно прашање заради бројот на корисници — туку како моделот функционира за македонскиот јазик во однос на квалитет на генерирање, познавање на локални референции и адекватност на стилот. На рамништето на контролата врз наративите, прашањето е во која мера македонските корисници имаат пристап до моделите со разбирање на тоа кои нормативни одлуки се вградени во нив. На рамништето на епистемичката колонизација, прашањето е најрадикално: кои се ефектите врз академскиот, литературниот и педагошкиот простор кога значителен дел од интелектуалната работа во овие сектори почнува да се одвива низ инфраструктура чии епистемички навики потекнуваат од друг културен и јазичен простор.
Можен одговор е трипартитен и стои на трите рамништа. На првото, тоа е критичка свест за ограничувањата и можностите на постоечките модели за работа со македонски јазик и култура, што вклучува и емпириска документација на овие ограничувања. На второто, тоа е транспарентна расправа во академскиот и образовниот сектор за тоа во кои контексти и со кои предупредувања може да се користат овие модели, и на тоа кои нормативни одлуки на модели не одговараат на локалните педагошки и научни стандарди. На третото, тоа е работа на одржување и развој на епистемички навики и форми на знаење кои не зависат целосно од оваа инфраструктура — поддршка на бавните, контекстуалните, локалните форми на интелектуална работа кои не се сводливи на брзи и плаузибилни одговори.
Овој последен момент е најзначаен и истовремено најтежок. Тој не се сведува на отфрлање на технологијата, нити на нејзино некритичко прифаќање. Тој подразбира способност за работа со и наспрема инфраструктурата истовремено — со свест за тоа што таа може и не може да обезбеди, и со одржување на тие форми на интелектуална работа што таа неможе да ги замени без значителен епистемички трошок.
7. Методолошки импликации: што значи да се прави критика на трите рамништа истовремено
Од сè досега изложеното произлегува методолошка задача што не е тривијална. Како се прави критика што е истовремено технички осведочена, политички прецизна и епистемолошки радикална, без таа да падне во една од трите познати замки: технократски редукционизам, морален генерализам или академски релативизам?
Првата замка е технократскиот редукционизам — претпоставката дека сите проблеми на ВИ можат да бидат адресирани со подобри метрики, побалансирани сетови на податоци и подобри инженерски решенија. Оваа позиција има своја привлечност, заради тоа што нуди концептуална чистота и операционализира самата критика. Но како што се покажа во дискусијата за пристрасноста, оваа позиција го прифаќа како имплицитна претпоставка тоа што самата критика треба да го стави под прашалник — дека некаква неутрална, поправена верзија на системот е возможна. Кога Буоламвини и Гебру даваат „Pilot Parliaments Benchmark“ како поправно средство, тие истовремено покажуваат и дека самата задача на бенчмаркирање не е заокружена — тоа е само еден чекор во поширок процес кој не може да биде сведен на технички.
Втората замка е моралниот генерализам — позицијата која се задоволува со изјавување дека ВИ има „етички проблеми“ или дека е „пристрасна“, без структурна анализа на тоа што конкретно ги произведува тие проблеми. Оваа позиција има тенденција да се појавува во документи на „АИ етика“ кои нудат принципи на високо ниво на општост — транспарентност, праведност, отговорност — без да навлезат во конкретните технички, регулаторни и политекономски конфигурации низ кои овие принципи се операционализираат или не се операционализираат. Поентираниот ризик е дека ваквиот генерализам станува самиот алибиен инструмент: компаниите можат да усвоат „етички принципи“ како форма на јавна репутациона работа, додека структурата на нивната работа остане непопречена.
Третата замка е академскиот релативизам — позиција која во име на епистемичката плуралност го отфрла секое тврдење за научна или техничка точност како форма на доминација. Иако радикалните декoлoнијални автори биле обвинети за вакво лизгање — особено во дебатите околу „кохерентноста на западната епистемологија“ како единствена цел на критика — поентираните формулации на оваа традиција не паѓаат во таа замка. Минголо, на пример, не тврди дека сите епистемички системи се еквивалентни; тој тврди дека хибрисот на нултата точка е специфична позиција која ризикува да го прикрие сопственото место на исказување како универзална основа на исказувањето воопшто.
Излезот од трите замки не е компромис меѓу нив, туку методолошки став кој се поставува надвор од сите три истовремено. Тој став подразбира емпириска прецизност (наспроти моралниот генерализам), структурна анализа на политичко-економскиот и инфраструктурниот контекст (наспроти технократскиот редукционизам) и одредена форма на епистемичка скромност што не паѓа во самопоништувачки релативизам (наспроти академскиот релативизам). Оваа методолошка позиција е тешка за заземање — но како што секоја сложена критичка работа покажува, токму невозможноста да се замени со некоја попроста позиција е знак дека таа фаќа нешто за феноменот што попростите позиции не го фаќаат.
Во практична смисла, ова значи дека академската работа со и наспроти ВИ мора да се одвива во неколку регистри истовремено. Во еден регистар, тоа е документирање на конкретните технички ограничувања на постоечките модели, со специфична внимателност за тоа како тие ограничувања се распоредени во однос на јазиците, културите и популациите. Во друг регистар, тоа е учество во расправите за политика на содржина, регулаторни рамки и стандарди на индустријата, со јасна свест за тоа дека тие расправи се одвиваат во структура на нееднаквост на моќта. Во трет регистар, тоа е негување и одржување на интелектуални традиции, форми на пишување, начини на расудување и педагошки пракси кои не се сводливи на она што инфраструктурата на големи јазични модели може да го репродуцира. Сите три регистри се потребни истовремено.
8. Заклучок
Овој текст се обиде да го направи продуктивно она што во првичната формулација „епистемичката колонизација, контролата на наративите и пристрасноста се негативната страна на современиот развој на ВИ“ останува заматено: дека трите концепта не се синоними и не се замислени само како кумулативна листа на проблеми. Тие се три различни рамништа на лоцирање на моќта во истиот феномен.
Пристрасноста живее во статистичките излези и е поправлива во рамките на постоечката парадигма. Контролата врз наративите живее во дискурзивната инфраструктура и нормативните одлуки на конкретни актери. Епистемичката колонизација живее во самата архитектура на инфраструктурата на знаење и претставува критика на парадигмата во која се конципираат „поправките“. Заедничкото им е тоа што во сите три случаи, моќта да се одредува што е знаење, што е разумна перспектива и што е валидно изразување се распоредени асиметрично, во полза на оние институции и контексти што имаа ресурси да ги изградат овие инфраструктури.
За академски и образовни простори надвор од центрите на оваа моќ, импликацијата не е да се отфрли инфраструктурата, нити да се прифати без критика. Импликацијата е критичкото учество — кое подразбира способност за работа со овие алатки и истовремено одржување на форми на знаење што не зависат целосно од нив. Тоа е работа што мора да биде поставена истовремено на сите три рамништа: техничка свест за ограничувањата на моделите, политичка свест за нормативните одлуки што се вградени во нив, и епистемичка свест за тоа кои форми на знаење мораат да бидат свесно одржувани заради сопствената интелектуална, културна и педагошка вредност.
Тоа што во моменталниот дискурс често се претставува како бинарна одлука помеѓу „прифаќање“ и „отфрлање“ на ВИ, во оваа рамка се нуди како лажна дихотомија. Прашањето не е дали ВИ е добра или лоша. Прашањето е каква инфраструктура на знаење сакаме да изградиме и одржуваме, и каква позиција треба да зазема во неа технологијата што е изградена надвор од нашите контексти. На тоа прашање мора да одговараме секојдневно — во наставата, во истражувањето, во редакцискта работа, во јавните дебати — а трите рамништа на критика што беа разработени во овој текст се обид да понудат речник со кој таа работа може да биде свесна за тоа што го прави.
Користена литература
Bender, Emily M., Timnit Gebru, Angelina McMillan-Major, и Shmargaret Shmitchell. „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜“. Во Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (FAccT ’21), 610–623. New York: ACM, 2021. https://doi.org/10.1145/3442188.3445922.
Buolamwini, Joy, и Timnit Gebru. „Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification“. Proceedings of Machine Learning Research 81 (2018): 77–91.
Crawford, Kate. Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. New Haven: Yale University Press, 2021.
D’Ignazio, Catherine, и Lauren F. Klein. Data Feminism. Cambridge, MA: The MIT Press, 2020.
Fricker, Miranda. Epistemic Injustice: Power and the Ethics of Knowing. Oxford: Oxford University Press, 2007.
Mignolo, Walter D. „Epistemic Disobedience, Independent Thought and Decolonial Freedom“. Theory, Culture & Society 26, бр. 7–8 (2009): 159–181.
Noble, Safiya Umoja. Algorithms of Oppression: How Search Engines Reinforce Racism. New York: NYU Press, 2018.
Quijano, Aníbal. „Coloniality of Power, Eurocentrism, and Latin America“. Преведено од Michael Ennis. Nepantla: Views from South 1, бр. 3 (2000): 533–580.
Santos, Boaventura de Sousa. Epistemologies of the South: Justice Against Epistemicide. Boulder, CO: Paradigm Publishers, 2014.