Цього понеділка Папа Лев XIV представив свою першу енцикліку, присвячену штучному інтелекту. Як запрошений спікера він звернувся до Крістофера Олаша з компанії Anthropic. Небувала подія. Ватикан простягає руку дружби Кремнієвій долині. І йдеться не про формальний жест, а про реальну співпрацю. Щоб зрозуміти, як ми до цього дійшли, потрібно звернутися до джерел створення Anthropic.
Чому саме Anthropic?
2021 рік. Дослідники із OpenAI покинули компанію. Даріо Амодей та його сестра Даніела пішли, щоби заснувати власну лабораторію. Вони переконані: моделі стають надто потужними, а логіка ринкової конкуренції більше не працює. Перегони за швидкістю вбивають нюанси.
Anthropic побудувала свій бренд на концепції безпеки ІІ. Їм потрібний контроль. Етичний посібник. Це призвело до створення підходу Конституційного ІІ. Уявіть систему, яка навчається на основі набору фундаментальних принципів, а не просто отримує латки після того, як зробить щось небезпечне.
Як зблизилися шляхи
Це не випадковість. Поява Олаша у Ватикані була продуманим рішенням. Святий Престол більше не хотів залишатися лише моральним спостерігачем з боку, а прагнув вступити у прямий діалог із тими, хто пише код.
Реальна робота розпочалася ще 2020 року з публікації «Римського звернення з етики ІІ». Папська академія життя об’єднала зусилля з Microsoft та IBM. Прозорість. Інклюзивність. Підзвітність. Звичайно, це стандартні кліше, але контекст стрімко змінився. ChatGPT підірвав ринок. США та Китай розпочали гонку озброєнь у сфері ІІ. Великі технологічні компанії набули лякаючої сили.
Ватикан усвідомив: питання етики технологій тепер має виживання людства. Anthropic вписалася в цю картину ідеально. Поки інші женуться за зростанням, Anthropic носить “безпеку” як свій головний відмітний знак.
Оточення Папи уважно стежило за прогресом у сфері вирівнювання ІІ (AI alignment).
Роль Крістофера Олаша
Крістофер Олаш – людина тиха. Про нього менше шуму в медіа, ніж про братів Амодей. Більше теорії. Більше філософії. Він вивчає “інтерпретованість моделей”. По суті він намагається зазирнути всередину «чорного ящика» нейронних мереж.
«Перетворювати нейронні мережі на алгоритми, зрозумілі людям.»
Така його мета. Вона ідеально перегукується із побоюваннями Лева XIV. Створення систем, надто складних для розуміння, є ризикованим. Небезпечно.
Контакти, ймовірно, активізувалися на тлі глобальних самітів з ІІ. Ватикан цінує компанії, які визнають: самотужки цю проблему не вирішити. Енцикліка повторює цю думку. Технології не є нейтральними. Алгоритми несуть у собі певну картину світу. Anthropic намагається “запікати” цінності безпосередньо в модель.
Спільна тривога. Глибока. Страх перед системами, що формуються під впливом прибутку та геополітики, а не здорового глузду.
Репутація як продукт
Це також є питання бізнесу. Для Anthropic.
Діалог із Папою підвищує авторитет. Концепція «етичної компанії у сфері ІІ» продає довіру. Особливо зараз, коли ІІ проникає у сферу праці, шпигунства та озброєнь. Їхній чат-бот Claude побудований мовою безпеки. Відповідальність стала частиною товару.
«Чудова» людяність
В енцикліці людина названа “чудовою (magnificus)”. Однак здатним і на знелюднення. ІІ – це не зло. Це дзеркало.
Папа застерігає від нового Цифрового Вавилону. Миру, де все зводиться до даних. Продуктивність. Ефективність. Істина йде на другий план.
Особлива увага приділяється концентрації приватної влади. Транснаціональним суб’єктам, які тримають поводи. Хто контролює модель? Хто обирає критерії навчання?
На презентації Олаш порушив протокол. Він визнав: навіть етичні компанії потрапляють у пастку економічних та геополітичних стимулів. Іноді ці стимули вступають у суперечність із моральним боргом. Він заявив: індустрія не здатна до саморегуляції. Крапка.
Хіросіма XXI століття
Аналогію з атомною бомбою побито. Але залишається актуальною. Ядерна зброя контролювалася державою. ІІ – приватним капіталом.
У цьому головна претензія Папи. Технологічна влада тепер має корпоративний характер.
І Ватикан, і експерти з безпеки ІІ бояться одного й того самого: спотворених стимулів.
Можливо, «Хіросіма XXII століття» не супроводжуватиметься вибухом. Можливо, вона буде тихою. Повільна автоматизація. Людство делегує своє мислення. Свої рішення. Свої стосунки.
- Magnifica humanitas* (Чудова людяність). Чи може вона обернутися жахом?
Побачимо.














































