„Google“ Dirbtinis Intelektas Tikriausiai Gali Jus Įveikti Vaizdo Žaidimuose

{h1}

Dirbtinai intelektuali kompiuterinė programa išmokė žaisti 49 klasikinius arkadinius vaizdo žaidimus su minimalia pagrindine informacija.

Kompiuteriai jau sumušė žmones prie šachmatų ir „Pavojus!“. Dabar jie gali į savo dangtelį pridėti dar vieną plunksną: galimybę geriausius žmones žaisti keliuose klasikiniuose arkadiniuose žaidimuose.

„Google“ mokslininkų komanda sukūrė dirbtinai intelektualią kompiuterinę programą, kuri gali išmokyti žaisti „Atari 2600“ vaizdo žaidimus, išmokdama groti, naudodama tik minimalią pagrindinę informaciją.

Imituodama kai kuriuos žmogaus smegenų principus, programa gali žaisti tokiu pat lygiu kaip profesionalus žaidėjas ar dar geriau, daugumoje žaidimų, pranešė mokslininkai šiandien (vasario 25 d.) Žurnale „Nature“. [Super intelektualios mašinos: 7 robotikos ateitis]

Tai yra pirmas kartas, kai kas nors sukūrė dirbtinio intelekto (AI) sistemą, galinčią išmokti tobulėti atliekant įvairias užduotis, vakar per spaudos konferenciją sakė tyrimo bendraautorius Demis Hassabis, Londono „Google DeepMind“ tyrėjas.

Būsimos šios PG programos versijos galėtų būti naudojamos bendresnėms sprendimų priėmimo programoms, pradedant be vairuotojų ir baigiant orų prognozavimu.

Mokymasis sustiprinant

Žmonės ir kiti gyvūnai mokosi sustiprindami elgesį, kuris maksimaliai padidina atlygį. Pavyzdžiui, dėl malonių potyrių smegenys išskiria cheminį neuromediatorių dopaminą. Tačiau norėdamos mokytis sudėtingame pasaulyje, smegenys turi aiškinti jutimų įvestį ir naudoti šiuos signalus apibendrinti praeities patirtį ir pritaikyti jas naujose situacijose.

Kai 1997 m. IBM „Deep Blue“ kompiuteris nugalėjo šachmatų senelį Garry Kasparovą, o dirbtinai intelektualus Watsono kompiuteris laimėjo viktorinos šou „Jeopardy!“. 2011 m. jie buvo laikomi įspūdingais techniniais žygdarbiais, tačiau dažniausiai tai buvo iš anksto užprogramuoti sugebėjimai, sakė Hassabis. Priešingai, naujoji „DeepMind AI“ gali mokytis savarankiškai, naudodama pastiprinimą.

Norėdami sukurti naują AI programą, Hassabis ir jo kolegos sukūrė dirbtinį neuroninį tinklą, pagrįstą „giliu mokymu“, mašininio mokymosi algoritmu, kuris palaipsniui sukuria abstraktesnius pirminių duomenų vaizdus. („Google“ garsiai naudojo gilųjį mokymąsi, kad apmokytų kompiuterių tinklą atpažinti kates pagal milijonus „YouTube“ vaizdo įrašų, tačiau šio tipo algoritmas iš tikrųjų naudojamas daugelyje „Google“ produktų - nuo paieškos iki vertimo.)

Naujoji AI programa vadinama „giluminiu Q tinklu“ arba DQN, ir ji veikia įprastame staliniame kompiuteryje.

Žaisti žaidimus

Tyrėjai išbandė DQN 49 klasikiniuose „Atari 2600“ žaidimuose, tokiuose kaip „Pong“ ir „Space Invaders“. Vieninteliai duomenys apie žaidimą, kuriuos gavo programa, buvo ekrano taškai ekrane ir žaidimo rezultatas. [Žr. „Google AI“, žaidžiančių vaizdo žaidimus, vaizdo įrašą]

„Sistema išmoksta žaisti iš esmės paspausdama klavišus atsitiktine tvarka“, kad būtų pasiektas aukštas rezultatas, - spaudos konferencijoje teigė tyrimo bendraautorius Volodymyras Mnihas, taip pat „Google DeepMind“ mokslininkas.

Po poros savaičių treniruočių DQN, kaip ir profesionalūs žaidėjai, atliko daugelį žaidimų, pradedant nuo šoninių slinkties šaudyklių ir baigiant 3D automobilių lenktynių žaidimais, teigė tyrėjai. Jie pridūrė, kad PG programa 75 proc. Žmonių įvertino daugiau nei puse žaidimų.

Kartais DQN atrado žaidimų strategijas, apie kurias tyrėjai net nepagalvojo, pavyzdžiui, žaidime „Seaquest“ žaidėjas kontroliuoja povandeninį laivą ir privalo vengti, rinkti ar naikinti skirtingo gylio objektus. AI programa atrado, kad ji gali likti gyva, tiesiog laikydama povandeninį laivą tiesiai po paviršiumi, teigė tyrėjai.

Sudėtingesnės užduotys

DQN taip pat pasinaudojo dar viena žmogaus smegenų ypatybe: galimybe atsiminti praeities išgyvenimus ir juos pakartoti, kad būtų galima vadovauti veiksmams (procesas, vykstantis jūrų arklio formos smegenų regione, vadinamame hipokampu). Panašiai DQN išsaugojo „prisiminimus“ iš savo patirties ir įtraukė juos į sprendimų priėmimo procesą žaidimo metu.

Tačiau žmogaus smegenys neprimena visų išgyvenimų vienodai. Jie yra linkę atsiminti labiau emociškai apkrautus įvykius, kurie greičiausiai bus svarbesni. Būsimose DQN versijose turėtų būti tokia neobjektyvi atmintis, teigė tyrėjai.

Dabar, kai jų programa įsisavino „Atari“ žaidimus, mokslininkai pradeda ją išbandyti sudėtingesniuose 90-ųjų žaidimuose, tokiuose kaip 3D lenktynių žaidimai. „Galų gale, jei šis algoritmas gali lenktyniauti automobiliu lenktynių žaidimuose su keliais papildomais pataisais, jis turėtų sugebėti vairuoti tikrą automobilį“, - teigė Hassabis.

Be to, būsimose AI programos versijose galbūt bus galima atlikti tokius veiksmus kaip planuoti kelionę į Europą, rezervuoti visus skrydžius ir viešbučius. Tačiau „mes labiausiai džiaugiamės naudodamiesi AI tam, kad padėtume daryti mokslą“, - teigė Hassabis.

Sekite Tanya Lewis „Twitter“. Sekite mus @gyvenimų mokslas, Facebook & „Google+“. Originalus straipsnis apie gyvą mokslą.


Vaizdo Papildas: .




Tyrimas


Iter Branduolių Sintezės Reaktorius, Kad Būtų Galima Atidėti Pagrindinius Fizikos Tyrimus
Iter Branduolių Sintezės Reaktorius, Kad Būtų Galima Atidėti Pagrindinius Fizikos Tyrimus

7 Keisčiausi 3D Spausdinimo Dalykai
7 Keisčiausi 3D Spausdinimo Dalykai

Mokslas Naujienos


Senovės Hijenos Valgė Žmonių Gimines Prieš Pusę Milijono Metų
Senovės Hijenos Valgė Žmonių Gimines Prieš Pusę Milijono Metų

Gyvūnų Seksas: Kaip Tai Daro Paukščiai
Gyvūnų Seksas: Kaip Tai Daro Paukščiai

Istorinis „Vaiduoklių Laivas“, Aptiktas Netoli Auksinių Vartų Tilto
Istorinis „Vaiduoklių Laivas“, Aptiktas Netoli Auksinių Vartų Tilto

Pasaulio Pabaiga, Kaip Mes Ją Žinome: Kas Atkreipia Dėmesį Į Moksleivių Distopijos Mokslą?
Pasaulio Pabaiga, Kaip Mes Ją Žinome: Kas Atkreipia Dėmesį Į Moksleivių Distopijos Mokslą?

Šventieji Sniego Ritinėliai! Keistai Sniego Kamuoliai Įsiveržia Į Jav
Šventieji Sniego Ritinėliai! Keistai Sniego Kamuoliai Įsiveržia Į Jav


LT.WordsSideKick.com
Visos Teisės Saugomos!
Dauginti Jokių Medžiagų Leidžiama Tik Prostanovkoy Aktyvią Nuorodą Į Svetainę LT.WordsSideKick.com

© 2005–2020 LT.WordsSideKick.com