Pályaelhagyó biológusként mindig is érdekelt a mesterségesintelligencia-kutatás biológiai háttere. E történet meghatározó pontja volt egy hányattatott gyerekkorú 20 éves egyetemi hallgató, Walter Pitts és a már negyvenes éveiben járó neurológus, Warren Sturgis McCulloch 1943-ban megjelentetett cikke: Az idegi tevékenységre jellemző tulajdonságok logikai elemzése (PDF). Pitts és McCulloch leírta azt, amit akkor az idegsejtek működéséről tudtak, és amellett érveltek, hogy e szerint az agy működése nagyon hasonló ahhoz, mint amit a logikában és a kialakuló informatikában digitális logikai kapuknak (AND, OR, XOR, NOT, NAND stb.) neveznek.

Az idegsejt „kimenete”, az úgynevezett axon a biológiai rendszerek zömétől eltérően nem analóg módon, hanem digitálisan működik: vagy kiad jelet, vagy nem (lásd HAMIS vagy IGAZ, illetve 0 vagy 1 a logikában és a számítástechnikában). A sejt kiadott jelét a kapcsolódó más idesejtek axon nyúlványain, mint „bemeneteken” érkező jelek összessége váltja ki. Ha az elér egy küszöb értéket, akkor kiváltja a sejt kimenetén a jelet, ha nem éri el, akkor nem. Egy idegsejt elágazó axonja több másik idegsejttel is kapcsolatot létesíthet, illetve több végződéssel is kapcsolódhat a következő idegsejthez. Ez utóbbi esetben a kapcsolat „súlya” nagyobb lesz. Az eredeti cikkből származó alábbi ábrák esetén a kimeneti jel kiváltásához legalább két bemeneti jel szükséges, de mindezt le tudja blokkolni egy üres körrel jelölt negatív kapcsolat.

 

A két szerző szerint ilyen idegsejt modellekből logikai, illetve számítástechnikai neurális hálózatok állíthatók össze, amelyek megfelelő konfigurációjával rengeteg típusú logikai művelet hajtható végre – hasonlóan ahhoz, ahogy az agyunk döntéseket hoz.

A következő években, évtizedekben ezen elv mentén olyan neurális hálózatok viselkedését kezdték vizsgálni, amelyek szimulált idegsejtek rétegeiből álltak, és a rétegek közt rengeteg kapcsolat volt. Eleinte egy-két réteggel dolgoztak, de kiderült, hogy absztraktabb problémákat csak köztes – úgynevezett rejtett – rétegek bevetésével lehet megoldani. Ezek a rétegek nem kapcsolódtak közvetlenül a teljes neurális hálózat bemeneteihez és kimeneteihez, hanem csak az előző és a következő réteg sejtjeihez.

Nagyon egyszerű neurális hálózatok esetén a kapcsolatok konfigurálását egy szakember még manuálisan – akkoriban még mindenféle kapcsolókkal, ellenállásokkal – is el tudta végezni. Így volt „tanítható” Frank Roseblatt 1958-ban bemutatott perceptronja, amely a 20 x 20 „pixeles” kameráján látott egyszerű ábrákat osztályozni volt képes. Bonyolultabb, nagyobb, több rétegű neurális hálók konfigurálása, azaz tanítása azonban így nem végezhető el reálisan. Ma ezt a munkát a „backpropagation” nevű matematikai műveletsorral lehet elvégezni. Ez a neurális háló tanítása során a hiba, a tévesztés nagyságából visszaszámolva próbálja kis lépésekben javítani a hálózat paramétereit mindaddig, amíg elég pontosan nem működik a hálózat, illetve amíg már további módosításokkal nem érhető el teljesítményjavulás.

Ezt a matematikai megoldást azonban csak jó pár évtizeddel a neurális hálózatok felfedezése után dolgozták ki teljesen. Addig valami mást kellett kitalálni, és az MI kutatók megint a biológiához, ez esetben az evolúcióelmélethez, az evolúció algoritmusához nyúltak vissza.

Az evolúció természetes szelekciós algoritmusa általánosítva a következőként fogalmazható meg: ha léteznek olyan objektumok (biológiai esetben az élőlény egyedek), amelyek

  1. szaporodásra képesek,
  2. a tulajdonságaikat átörökítik leszármazottaiknak,
  3. e tulajdonságok kismértékben véletlenül megváltozhatnak, és
  4. tulajdonságaik befolyásolják szaporodási sikerüket,

akkor ezek az objektumok generációról generációra úgy változnak meg, hogy egyre jobban fognak a környezetükhöz alkalmazkodni.

A neurális hálózatok esetén a tulajdonságokat a hálózat kapcsolatai, struktúrája, paraméterei jelentik, az alkalmazkodás pedig azt, hogy mennyire jól teljesít a hálózat a felismerésben, osztályozásban. Kiindultak tehát egy szinte véletlenszerűen felparaméterezett neurális hálózatból (az objektum), majd csináltak belőle a számítógépen sok-sok példányt (szaporodás) úgy, hogy közben a „leszármazott” hálózatok néhány véletlenül kiválasztott paraméterét véletlenszerűen megváltoztatták (mutációk). Ezeket az új hálózatokat tesztelték a tanító mintákkal, és a rosszul teljesítőket kidobták (szelekció). A néhány legjobból megint kicsit tökéletlen másolatot csináltak és így tovább. Az ilyen, jól automatizálható véletlen és egyáltalán nem véletlen folyamatok (mutáció és szelekció) révén elégséges számú generáció után a neurális hálózatok úgy változtak meg, hogy jó minőségben teljesítették a megtanulandó feladatot. Például a garázsba behajtó autók rendszámát akkor is megfelelő pontossággal felismerték, ha nem volt elég világos, esett az eső, vagy koszos volt a rendszámtábla. Az evolúciós algoritmus sikere a neurális hálózatok tanításában önmagában is fontos eredmény, de egyben a biológia fele is visszaigazolás volt, hogy lám, a Charles Darwin és Alfred Russel Wallace által még a tizenkilencedik század közepén javasolt – és azóta sokszorosan igazolt – természetes szelekciós folyamat nem biológiai rendszerekben is képes meghökkentően komplex és jól működő rendszereket létrehozni.

Az elmúlt évtizedekben az evolúciós tanító algoritmusok használata visszaszorult a már említett backpropagation alapú matematikai megoldások sikere miatt. Éppen ezért meglepődtem most a cikk megírására készülődve, amikor rátaláltam néhány tanulmányra, amelyek mintha e régi módszer reneszánszát jeleznék előre. Az Uber MI kutatás-fejlesztési laboratóriumának tagjai több kutatási eredményről számolnak be, amelyek szerint sikeresen – bizonyos esetekben a backpropagation módszernél hatékonyabban – tudtak tanítani evolúciós algoritmusokkal igen nagy neurális hálózatokat. Az algoritmust számos pontban tökéletesítették, és az is hozzájárult a régi módszer feltámadásához, hogy ma a hálózatok „szaporítását”, és az „egyedek” tesztelését az új párhuzamos programozási módszerek, az ezt támogató speciális hardverek is segítik. Az MI kutatás tehát láthatóan sokat köszönhet a biológia eredményeinek.

A sorozat következő részében arról fogok írni, hogy mit tud mondani az MI az emberi elme hibáiról, torzításairól, rossz szokásainkról, szenvedélybetegségeinkről. Mert mintha ezeket a jellemzőket bizonyos MI megoldások is kezdenék mutatni, ami a biológiai örökség miatt talán nem is olyan nagyon meglepő.

 

Hraskó Gábor

Az INNObyte CCS Üzletágvezetője