Dirbtinio Intelekto Plaka „Sudėtingiausias Žmonių Sukurtas Žaidimas“

{h1}

„google“ dirbtinio intelekto „deep mind“ sistema nugalėjo profesionalų „go“ žaidėją ir išsprendė vieną didžiausių iššūkių šioje srityje.

Paruoškite kelią robotams.

Dirbtinio intelekto sistema nugalėjo profesionalų „Go“ žaidėją ir įveikė vieną iš senų grandiozinių iššūkių šioje srityje. Be to, naujoji sistema, vadinama „AlphaGo“, nugalėjo žaidėją - jis išmoko žaidimą nuo nulio, naudodamas „giluminio mokymosi“ metodą.

Stulbinantis pralaimėjimas leidžia manyti, kad naujoji dirbtinio intelekto (AI) mokymosi strategija gali būti galinga priemonė kitose arenose, pavyzdžiui, analizuojant klimato duomenų be matomos struktūros analizes ar nustatant sudėtingas medicinines diagnozes, teigė mokslininkai.

Tyrėjai pranešė apie naują susitikimą internete šiandien (sausio 27 d.) Žurnale „Nature“. [Itin intelektualios mašinos: 7 robotikos ateitis]

Žmogus prieš mašiną

Nuo tada, kai 1997 m. „IBM Deep Blue“ nugalėjo Gary Kasparovą jų ikoninėse šachmatų varžybose, AI tyrinėtojai tyliai kūrė robotus, galinčius įvaldyti vis daugiau ir daugiau žmonių pramogų. 2014 m. „IBM Watson“ nugalėjo „Jeopardy!“ čempionas Kenas Jenningsas, o praėjusiais metais kompiuteris pavadinimu Claudico - kuris gali „blefuoti“ per „Heads-Up No-Limit Texas Hold 'em“ - padėjo žmonėms, pokerio žaidėjams, bėgti už savo pinigus Pitsburgo kazino.

Tačiau „Go“ buvo kur kas sunkiau nulaužti riešutą. Strateginis žaidimas, kuris prieš maždaug 2500 metų atsirado Kinijoje, remiasi apgaulingai paprastomis taisyklėmis. Žaidėjai uždeda baltus ir juodus akmenis ant didelės grotos lentos, kad apjuostų didžiąją dalį teritorijos. Sakoma, kad vienos spalvos akmenys, galintys paliesti kitus draugiškus akmenis, yra gyvi, o tie, kurių pabėgimo keliai yra nukirpti, yra mirę.

Tačiau už paprastų taisyklių slypi neįtikėtino sudėtingumo žaidimas. Geriausi žaidėjai visą gyvenimą praleidžia įsisavindami žaidimą, išmokdami atpažinti judesių, tokių kaip „kopėčios“, seką, kurdami strategijas, kaip išvengti nesibaigiančių kautynių už teritoriją, vadinamą „ko wars“, ir ugdydami nepaprastą sugebėjimą pažvelgti į „Go“ žaidimą. Įlipkite į lentą ir akimirksniu žinokite, kurie gabalai yra gyvi, negyvi ar apnuoginti.

„Tai turbūt pats sudėtingiausias žmonių sugalvotas žaidimas“, - vakar (sausio 26 d.) Spaudos konferencijoje sakė tyrimo bendraautorius Demis Hassabis, Londono „Google DeepMind“ kompiuterių mokslininkas. "Joje yra nuo 10 iki 170 galimų plokštės vietų, o tai yra daugiau nei atomų skaičius Visatoje."

Raktas į šį sudėtingumą yra Go „išsišakojimo modelis“, sakė Hassabis. Kiekvienas „Go“ žaidėjas turi galimybę pasirinkti iš 200 judesių kiekviename savo posūkyje, palyginti su 20 galimų judesių per vieną posūkį šachmatuose. Be to, nėra lengvo būdo tiesiog pažvelgti į lentą ir įvertinti, kaip gerai žaidėjui sekasi bet kuriuo metu. (Priešingai, žmonės gali susidaryti grubią idėją, kas laimi šachmatų žaidimą, tiesiog priskirdami taškines vertes kiekvienam vis dar žaidžiamam ar užfiksuotam kūriniui. - Hassabis teigė.)

Dėl to geriausios PG sistemos, tokios kaip IBM „Deep Blue“, sugebėjo įveikti tik mėgėjiškus „Go“ žaidėjus. [10 technologijų, kurios pakeis jūsų gyvenimą]

Gilus mokymasis

Anksčiau ekspertai mokė AI sistemų konkrečių judesių sekų ar taktinių modelių. Vietoj šio metodo Hassabis ir jo kolegos parengė programą, vadinamą AlphaGo, nenaudodami išankstinių įsitikinimų.

Programa naudoja požiūrį, vadinamą giliu mokymu arba giliaisiais neuroniniais tinklais, kai skaičiavimai vyksta keliuose hierarchiškai organizuotuose sluoksniuose, o programa teikia informaciją iš žemesnio lygio į kiekvieną iš eilės aukštesnį sluoksnį.

Iš esmės „AlphaGo“ „stebėjo“ milijonus „Go“ žaidimų tarp žmonių, kad išmoktų žaidimo taisyklių ir pagrindinės strategijos. Tada kompiuteris žaidė milijonus kitų žaidimų, kad sugalvotų naujas „Go“ strategijas. Vien tik „AlphaGo“ baigė įsisavinti pagrindines vietinių judesių sekas ir suvokti didesnius taktinius modelius, teigė tyrėjai.

Vykdydamas šią užduotį, „AlphaGo“ remiasi dviem neuroninių tinklų rinkiniais - vertybiniu tinklu, kuris iš esmės peržiūri lentos pozicijas ir nusprendžia, kas laimi ir kodėl, bei politikos tinklu, kuris pasirenka judesius. Laikui bėgant, politiniai tinklai mokė vertybių tinklus, kad pamatytų, kaip vyksta žaidimas.

Skirtingai nuo ankstesnių metodų, kuriais buvo bandoma apskaičiuoti kiekvieno galimo judesio naudą naudojant brutalią jėgą, programoje svarstomi tik tie žingsniai, kuriuos greičiausiai galima laimėti, teigė tyrėjai, o tai yra požiūris, kurį naudoja geriausi žaidėjai.

„Mūsų paieška žvelgia į priekį žaidžiant žaidimą daugybę kartų savo vaizduotėje“, - spaudos konferencijoje sakė tyrimo bendraautorius Davidas Silveris, „Google DeepMind“ kompiuterių mokslininkas, padėjęs sukurti „AlphaGo“. "Tai daro" AlphaGo "paiešką daug žmogiškesnį nei ankstesni požiūriai."

Visiškas žmogaus pralaimėjimas

Atrodo, kad mokymasis iš žmonių yra strategija.

„AlphaGo“ varžė AI sistemas maždaug 99,8 proc. Laiko ir turnyre įveikė valdantįjį „Europos Go“ čempioną Faną Hui, laimėdamas visas penkerias rungtynes. Nepaisant kitų AI sistemų, programa gali būti vykdoma įprastu staliniu kompiuteriu, tačiau turnyro prieš Hui metu komanda padidino „AlphaGo“ apdorojimo galią, naudodama apie 1200 centrinių procesorių (CPU), padalinusių skaičiavimo darbą.

Ir „AlphaGo“ dar nėra baigtas su žmonėmis. Ji paskelbė Lee Sedolio, geriausio pasaulyje „Go“ žaidėjo, žvilgsnį, o po kelių mėnesių planuojama atlikti veidą.

„Galite galvoti apie jį kaip apie Rogerį Federerį iš„ Go “pasaulio“, - teigė Hassabis.

Daugybė „Go“ pasaulio šalių buvo apstulbę dėl pralaimėjimo ir vis dar teikė viltį paprastajam mirtingajam, kuris kovo mėnesį susidurs su „AlphaGo“.

"„ AlphaGo “jėgos yra tikrai įspūdingos! Aš buvau pakankamai nustebęs, kai išgirdau„ Fan Hui “pralaimėjimą, tačiau atrodo realiau matyti žaidimo įrašus“, - pranešime teigė Tarptautinės Go konfederacijos generalinis sekretorius Hajinas Lee. "Mano bendras įspūdis buvo toks, kad„ AlphaGo “atrodė stipresnis už„ Faną “, tačiau aš negalėjo pasakyti, kiek. Vis dar abejoju, ar jis pakankamai stiprus, kad vaidintų geriausius pasaulio profesionalus, bet galbūt tampa stipresnis, kai susiduria su stipresniu priešininku.“

Sekite Tia Ghose „Twitter“ir „Google+“. Sekite Gyvasis mokslas @gyvenimų mokslas, Facebook & „Google+“. Originalus straipsnis apie Gyvasis mokslas.


Vaizdo Papildas: .




LT.WordsSideKick.com
Visos Teisės Saugomos!
Dauginti Jokių Medžiagų Leidžiama Tik Prostanovkoy Aktyvią Nuorodą Į Svetainę LT.WordsSideKick.com

© 2005–2020 LT.WordsSideKick.com