Czy kontekstualna AI (już) istnieje?

1 rok temu

Z byciem copywriterem jest jak z każdym innym kreatywnym zawodem. Jedyna różnica jest taka, iż masz więcej otwartych kart w przeglądarce. Szymon potrzebował więc inspiracji. Potrzebował czegoś, co wstrząśnie jego czytelnikami. Artykułu na bloga, który podbije świat. Zrobił więc jedyną rzecz, która mogła pomóc mu to zrealizować…

Pojechał na wakacje.

Inspiracja zawsze tam jest; Czeka, aż ją znajdziesz. Musisz tylko zapomnieć o swoich lękach i oczekiwaniach. Kluczem do sukcesu jest pozwolenie, by mózg przejął kontrolę. Nie ma znaczenia, co robisz i gdzie jesteś. Dopóki się relaksujesz, będziesz w stanie spojrzeć na sprawy inaczej. Z kreatywnością.

Szymon cieszył się więc miłym śniadaniem w kawiarni na świeżym powietrzu, kiedy zauważył coś osobliwego. Coś tak dziwnego, iż nie mógł uwierzyć własnym oczom. Starszy mężczyzna idący po drugiej stronie ulicy niósł dużą, niebieską torbę, wypełnioną zabawkami. Na pierwszy rzut oka wydawał się spokojny i opanowany. Jednak gdy tylko ktoś się do niego zbliżył, zaczynał histerycznie krzyczeć i płakać.

— Co się stało? — Szymon zapytał kelnerkę. — Czy wszystko jest tam w porządku?
Kelnerka wzruszyła ramionami i powiedziała — Nie wiem.
— Czy nikt nie zapytał go, czy wszystko w porządku? Może jest chory — zasugerował Szymon.
Kobieta potrząsnęła głową. — Mówi, iż próbują ukraść jego zabawki. Dlatego nosi je przy sobie.
— Cóż, myślę, iż powinniśmy pójść z nim porozmawiać — powiedział Szymon.

Jaka jest dalsza część przygód copywritera? Cóż, ja niestety nie znam odpowiedzi na to pytanie. Na pewno jednak zna je Novel.AI, bo w gruncie rzeczy to ona jest twórcą tej historii. Ja jedynie podałem jej wstęp, czyli tekst zawarty w cytacie.

W ostatnich latach sztuczna inteligencja po cichu przenika do codziennego życia. Urozmaica, ułatwia i poprawia naszą pracę. A jednak, działanie większości sztucznych inteligencji ograniczone jest dziś do jednego, dość wąskiego obszaru — mamy AI, która personalizuje reklamy, zarządza smart home czy rozpoznaje twarz użytkownika. Czy jednak taką AI można nazwać naprawdę inteligentną?

Krótka historia nauki AI

Jeśli chcesz dowiedzieć się, czym adekwatnie jest sztuczna inteligencja i jak powstawała, to opisaliśmy to tutaj.

Inteligencja inteligencją, ale skąd adekwatnie AI wie, co ma robić? Jak wykonuje polecenia użytkownika i dlaczego? Cóż, w pierwszej połowie XX wieku wszystkie algorytmy były programowane manualnie. Nie było to jednak rozwiązanie zbyt optymalne i zajmowało bardzo dużo czasu. Około 1960 roku pojawiły się pierwsze systemy symulujące neurony i połączenia między nimi. AI zaczęła być nagradzana za tworzenie połączeń, które przybliżały ją do działania w pożądany sposób.

Dziś proces zwykle wygląda tak: sztuczna inteligencja operuje na komputerowo stworzonych sieciach neuronalnych i wykorzystuje moc obliczeniową, by uczyć się nowych zachowań. w uproszczeniu — częściowo odtwarzamy działanie ludzkiego mózgu.

Przykładowo: AI chcąc nauczyć się rozpoznawać na zdjęciu kota, musi wykorzystać moc obliczeniową, by przeanalizować ułożenie pikseli w setkach tysięcy grafik. Później zapamiętuje schematy w postaci sieci neuronowych. Dzięki temu kojarzy kształty i kolory, które mogą wskazywać na to, iż na zdjęciu widać kota. Brzmi nienaturalnie? Cóż wcale nie powinno. W końcu dzieci uczą się na bardzo podobnej zasadzie.

Jeśli pokażemy bardzo małemu dziecku kilka zdjęć kota, to dziecko zapamięta, jak to zwierzę wygląda. jeżeli potem pokażemy mu zdjęcie psa, to prawdopodobnie również powie, iż jest to kot. Pies ma podobne cechy (4 nogi, sierść, uszy, oczy), więc wynik jest prosty: także jest kotem.

Dopiero nabycie większej ilości wiedzy lub informacji z innych zmysłów (na przykład dźwięk miauczenia kota lub faktura jego futra) urozmaici w umyśle obraz kota. Pozwoli to odróżnić go od innych, podobnych zwierząt. Do tego czasu jednak dziecko będzie operować na prostych schematach. Będzie działać w wąskiej dziedzinie, nie wykorzystując do myślenia innej wiedzy, bo zwyczajnie jej nie ma. Zupełnie tak, jak większość dzisiejszych AI.

Inteligencja kontekstualna

Jeff Dean podczas swojego wystąpienia na konferencji TED opisał jak mogłaby działać prawdziwie inteligentna AI. Nazywa ją inteligencją kontekstualną.

Dlaczego akurat kontekstualną?

Cóż, warto zacząć od zdefiniowania, czym jest kontekst. Wg słownika sjp słowo kontekst wywodzi się z łacińskiego contextus, które oznacza związek, zależność, łączność.

W tym wypadku umiejętność operowania na kontekstach wymaga posiadania wiedzy z różnych dziedzin. Naprawdę inteligentna AI uczy się nie tylko z podawanych jej danych, ale również z tego, czego dowiedziała się wcześniej. Łączenie polega zatem na kojarzeniu nowych i starych informacji.

Załóżmy iż przerzucamy się z samochodu z automatyczną skrzynią biegów, na taki z manualną. Nie musimy uczyć się od nowa, jak działa samochód. Wykorzystamy naszą poprzednią wiedzę i nauczymy się tylko tego, jak działa sprzęgło i biegi.

Tak samo kontekstualna AI będzie odwoływać się do nabytej już wcześniej wiedzy. Operowanie na kontekstach natomiast pozwoli jej na wykazanie się kreatywnością.

No właśnie —ponownie… czym adekwatnie jest kreatywność? Otóż, wg słownika sjp:

Kreatywność to proces umysłowy pociągający za sobą powstawanie nowych idei, koncepcji, lub nowych skojarzeń, powiązań z istniejącymi już ideami i koncepcjami. Myślenie kreatywne to myślenie prowadzące do uzyskania oryginalnych i użytecznych rozwiązań. Alternatywna, bardziej codzienna definicja kreatywności mówi, iż jest to po prostu zdolność tworzenia czegoś nowego.

Czy dzisiejsze AI można zatem nazwać kreatywnym? Cóż, jest ono na tyle dobre w tworzeniu, iż w tym roku wygrało na przykład w konkurs artystyczny w Colorado.

Twórca (współtwórca?) obrazu — James Allen wykorzystał AI o nazwie Midjourney, które generuje obrazy na podstawie wprowadzonych słów. Podobnie jak ja wykorzystałem ją, by stworzyć wrzucony wyżej obrazek do krótkiej historyjki wygenerowanej przez Novel.AI.

No dobrze, zatem jaki w końcu jest aktualny etap rozwoju sztucznej inteligencji? AI, która generuje takie obrazy, z pewnością jest bardzo dobra w tym co robi, ale czy jest inteligencją kontekstualną?

Cóż… i tak i nie.

Między 2 i 3 falą AI

Jesteśmy aktualnie w fazie przejściowej. Przykładowo, AI zaczyna już być całkiem niezłe w rozumieniu naszego języka. Dowodem tego niech będą wszechobecni asystenci głosowi tacy jak Siri czy asystent Google. Ba, IBM stworzyło choćby maszynę, która może uczestniczyć w debatach politycznych — Debatera. Expansio z kolei stworzyło chatbota, który rozumie język naturalny i potrafi przyswoić treść dokumentów. Dzięki temu może odpowiedzieć na pytania pracowników.

Takie rozumienie języka przez AI to z pewnością niesamowite osiągnięcie technologiczne. Wciąż jesteśmy jesteśmy dość daleko od komunikowania się z AI jak z drugim człowiekiem. Ludzki język jest nośnikiem znaczeń, potrzeb, wyobrażeń, planów, emocji, obrazów, wspomnień. Aktualnie AI ma dostęp do niewielu z tych kontekstów. Ma dostęp do tych, które możliwe są do przekazania w formie cyfrowej.

Inny przykład — Adobe Sensei to narzędzie wykorzystujące Deep Learning do symulowania ludzkiego spojrzenia na obrazy. Rozpoznaje ono pojedyncze elementy takie jak twarze, przedmioty, całe scenerie, jak i choćby emocje osób ze zdjęcia.

W pewien sposób jego rozumienie cyfrowego świata można porównać do ludzkiego. W końcu my też operujemy na tzw. reprezentacjach poznawczych — umysłowych odpowiednikach osób, przedmiotów czy kategorii. Na każdą reprezentację składają się pewne skojarzenia i wiedza.

Podobnie jak Adobe Sensei oceniamy to, co widzimy z pewnym prawdopodobieństwem – nam również czasem zdarzają się pomyłki w rozpoznawaniu przedmiotów czy osób. Wystarczy niekorzystne oświetlenie, pojawienie się złudzenia optycznego czy chwilowy brak uwagi.

BigData Chatbot — Case study z pierwszej ręki

Rozumienie zwykłego, codziennego języka jest trudne. Rozumienie profesjonalnego, służbowego języka, używanego w dokumentach wydaje się zatem niezwykłym wyzwaniem. Ale… spróbowaliśmy. No i wygląda na to, iż się udało.

BigData chatbot nie tylko bowiem znajduje potrzebne informacje w gąszczu docsów, docxów i pdfów. Wyciąga on również najważniejszą informację i przekazuje ją w prostszy, bardziej kolokwialny sposób. Używa synonimów, skraca zdania i, w razie potrzeby, podaje źródło.

Dodatkowo chatbot rozumie kontekst zapytania użytkownika. Pytając o dane firmy, nie wykorzysta on pierwszej odpowiedzi, w której znajdzie się taka fraza. Będzie szukał na podstawie schematów danych (adres, telefon), podobnie jak zrobiłby to człowiek.

A skoro wiemy już co nieco o inteligencji kontekstualnej, to warto zadać pytanie: Czy można nazwać BigData chatbota kontekstualnie inteligentnym?

Na pewno nie w pełni — myślę, iż na podobnym poziomie, co Novel.AI, Debator czy Adobe Sensei.

Nie zmienia to jednak faktu, iż zarówno BigData chatbot jak i każde z tych narzędzi przybliża nas do stworzenia SuperAI — Programu, który będzie w stanie rozumieć konteksty z wielu różnych dziedzin. Ale o tym… w następnym wpisie :)

Idź do oryginalnego materiału