Провідні дослідники штучного інтелекту в Кремнієвій долині стикаються з викликом загальноприйнятій думці про штучний загальний інтелект (AGI). Янн ЛеКун, колишній керівник Meta AI і відомий критик підходу великої мовної моделі (LLM), підтримує стартап під назвою Logical Intelligence, який розробляє радикально інший метод. ЛеКун стверджує, що нинішня одержимість LLM — системами, які передбачають наступне слово в послідовності — зайшла в глухий кут. Натомість він вважає, що шлях до справжнього ШІ лежить через системи, які міркують, а не просто здогадуються.
Енергетичне міркування: новий підхід до ШІ
Компанія Logical Intelligence розробила «модель на основі енергії» (EBM), яка навчається шляхом інтерналізації обмежень, а не прогнозування результатів. На відміну від LLM, EBM працюють у певних параметрах, наприклад, за правилами головоломки судоку, щоб розв’язувати проблеми без проб і помилок. У стартапі стверджують, що цей метод потребує значно менше обчислювальної потужності та виключає помилки.
Перша модель компанії, Kona 1.0, продемонструвала кращу продуктивність порівняно з провідними LLM у вирішенні головоломок Sudoku під час роботи на одній відеокарті Nvidia H100. Це свідчить про те, що ефективного міркування можна досягти без масштабу сучасних LLM. Logical Intelligence була першою компанією, яка розробила діючу EBM, яка раніше була лише теоретичною концепцією.
За межами мови: майбутнє ШІ
Стартап бачить, що EBM вирішують реальні проблеми, де важлива точність, наприклад оптимізація електромереж або автоматизація складного виробництва. Засновник і генеральний директор Ів Бодня наголошує, що ці завдання «зовсім не пов’язані з мовою», що означає, що фокус має бути зміщений з лінгвістичних сильних сторін LLM.
Logical Intelligence планує співпрацювати з AMI Labs, іншим стартапом, заснованим Лекуном, який розробляє «моделі світу» — системи ШІ, які розуміють фізичні вимірювання, зберігають спогади та передбачають результати. Кінцева мета полягає в тому, щоб поєднати ці підходи: LLM для людської взаємодії, EBM для міркування та моделі світу для дій у реальному світі.
Зміщення перспективи
Основний аргумент полягає в тому, що поточний розвиток штучного інтелекту має недоліки. LLM покладаються на чисту величину та статистичну ймовірність, тоді як справжній інтелект вимагає більш фундаментального підходу до міркування. ЛеКун і Бодня припускають, що імітація людської мови не є ключем до розблокування AGI; натомість штучний інтелект має зосередитися на абстрактному вирішенні проблем без мовних обмежень.
Команда очікує, що EBM буде розгорнуто в таких галузях, як енергетика, фармацевтика та виробництво. Підхід компанії до розробки невеликих спеціалізованих моделей для конкретних завдань, а не одного загального призначення ШІ, може запропонувати більш практичний шлях вперед.
Шлях до AGI, згідно з Logical Intelligence, починається з багаторівневого підходу, що поєднує різні типи штучного інтелекту, кожен з яких оптимізований для певних функцій.
Ця нова модель кидає сміливий виклик поширеному наративу в Силіконовій долині, припускаючи, що майбутнє штучного інтелекту може полягати не в більших LLM, а в розумніших системах міркування.














































