Czołowi badacze sztucznej inteligencji w Dolinie Krzemowej stoją przed wyzwaniem dla konwencjonalnej wiedzy na temat sztucznej inteligencji ogólnej (AGI). Yann LeCun, były szef Meta AI i wybitny krytyk podejścia opartego na modelu dużego języka (LLM), wspiera start-up o nazwie Logical Intelligence, który opracowuje radykalnie odmienną metodę. LeCun argumentuje, że obecna obsesja na punkcie LLM – systemów przewidujących następne słowo w sekwencji – to ślepy zaułek. Zamiast tego wierzy, że droga do prawdziwej sztucznej inteligencji wiedzie poprzez systemy, które rozumują, a nie tylko zgadują.

Rozumowanie energetyczne: nowe podejście do sztucznej inteligencji

Logical Intelligence opracowało „model oparty na energii” (EBM), który uczy się poprzez internalizację ograniczeń, a nie przewidywanie wyników. W przeciwieństwie do LLM, EBM działają w oparciu o określone parametry – takie jak zasady Sudoku – aby rozwiązywać problemy bez prób i błędów. Startup twierdzi, że metoda ta wymaga znacznie mniejszej mocy obliczeniowej i eliminuje błędy.

Pierwszy model firmy, Kona 1.0, wykazał się doskonałą wydajnością w porównaniu z wiodącymi LLM w rozwiązywaniu łamigłówek Sudoku podczas pracy na jednej karcie graficznej Nvidia H100. Sugeruje to, że skuteczne rozumowanie można osiągnąć bez skali nowoczesnych LLM. Logical Intelligence jako pierwsza firma opracowała działający EBM, który wcześniej był jedynie koncepcją teoretyczną.

Poza językiem: przyszłość sztucznej inteligencji

W startupie EBM rozwiązują rzeczywiste problemy, w których ważna jest precyzja, na przykład optymalizacja sieci energetycznych lub automatyzacja złożonej produkcji. Założyciel i dyrektor generalny Yves Bodnya podkreśla, że ​​zadania te są „całkowicie niezwiązane z językiem”, co sugeruje, że uwaga powinna zostać przeniesiona z mocnych stron językowych szkół wyższych.

Logical Intelligence planuje współpracę z AMI Labs, kolejnym start-upem założonym przez LeCuna, który opracowuje „modele świata” – systemy sztucznej inteligencji, które rozumieją pomiary fizyczne, przechowują wspomnienia i przewidują wyniki. Ostatecznym celem jest połączenie tych podejść: LLM do interakcji międzyludzkich, EBM do rozumowania i światowych modeli do działań w świecie rzeczywistym.

Zmiana perspektywy

Głównym argumentem jest to, że obecny rozwój sztucznej inteligencji jest wadliwy. LLM opierają się na czystej wielkości i prawdopodobieństwie statystycznym, podczas gdy prawdziwa inteligencja wymaga bardziej fundamentalnego podejścia do rozumowania. LeCun i Bodnya sugerują, że naśladowanie ludzkiego języka nie jest kluczem do odblokowania AGI; zamiast tego sztuczna inteligencja powinna skupiać się na abstrakcyjnym rozwiązywaniu problemów bez ograniczeń językowych.

Zespół spodziewa się, że EBM zostanie wdrożony w takich branżach, jak energetyka, farmaceutyka i produkcja. Podejście firmy polegające na opracowywaniu małych, wyspecjalizowanych modeli do konkretnych zadań – zamiast jednej sztucznej inteligencji ogólnego przeznaczenia – mogłoby zaoferować bardziej praktyczną drogę naprzód.

Według Logical Intelligence droga do AGI zaczyna się od wielowarstwowego podejścia łączącego różne typy sztucznej inteligencji, każdy zoptymalizowany pod kątem określonych funkcji.

Ten nowy model stanowi śmiałe wyzwanie dla dominującej narracji w Dolinie Krzemowej, sugerując, że przyszłość sztucznej inteligencji może nie leżeć w większych LLM, ale w inteligentniejszych systemach rozumowania.