Naujas Dirbtinis Intelektas Gali Papasakoti Istorijas, Paremtas Nuotraukomis

{h1}

Dirbtinis intelektas vieną dieną gali suvokti frazės „paveikslas yra vertas tūkstančio žodžių“ reikšmę, nes dabar mokslininkai moko programas apibūdinti vaizdus taip, kaip tai darytų žmonės.

Dirbtinis intelektas vieną dieną gali suvokti frazės „paveikslas yra vertas tūkstančio žodžių“ reikšmę, nes dabar mokslininkai moko programas apibūdinti vaizdus taip, kaip tai darytų žmonės.

Kažkada kompiuteriai gali net paaiškinti, kas vyksta vaizdo įrašuose, kaip žmonės gali, - teigė tyrėjai naujame tyrime.

Kompiuteriai vis geriau atpažįsta veidus ir kitus vaizde esančius elementus. Pastaruoju metu dėl šių pažangų atsirado vaizdų fiksavimo įrankiai, sukuriantys pažodinius vaizdų aprašymus. [Super intelektualios mašinos: 7 robotikos ateitis]

Dabar „Microsoft Research“ mokslininkai ir jų kolegos kuria sistemą, kuri galėtų automatiškai apibūdinti vaizdų serijas panašiai, kaip pasakodamas istoriją. Tikslas yra ne tik paaiškinti, kokie daiktai yra nuotraukoje, bet ir tai, kas vyksta ir kaip tai gali potencialiai priversti žmogų jaustis, teigė tyrėjai. Pavyzdžiui, jei žmogui parodoma smokingo vyro nuotrauka ir moteris su ilga balta suknele, užuot sakiusi: „Tai yra nuotaka ir jaunikis“, jis arba ji galėtų pasakyti: „Mano draugai susituokė Jie atrodo tikrai laimingi; tai buvo gražios vestuvės ".

Tyrėjai bando suteikti dirbtiniam intelektui tas pačias pasakojimo galimybes.

„Tikslas yra padėti suteikti AI labiau į žmogų panašų intelektą, padėti suprasti dalykus abstraktesniu lygmeniu - ką reiškia būti linksmam ar droviam, ar keistam, ar įdomiam“, - teigė tyrimo vyresnioji autorė, Margaret Mitchell, kompiuterių žinovė „Microsoft“ tyrimai. "Žmonės perdavė amžių istorijas, naudodamiesi jomis mūsų moralės, strategijų ir išminties perteikimui. Sutelkdami dėmesį į pasakojimą, mes tikimės padėti AI suprasti žmogaus sampratas tokiu būdu, kuris yra labai saugus ir naudingas žmonijai, o ne mokyti. kaip įveikti žmoniją “.

Pasakoja istoriją

Norėdami sukurti vaizdinę pasakojimo sistemą, tyrėjai pasitelkė giliuosius neuroninius tinklus, kompiuterines sistemas, kurios mokosi iš pavyzdžių - pavyzdžiui, išmokdami atpažinti kates nuotraukose, analizuodami tūkstančius kačių vaizdų pavyzdžių. Tyrėjų sukurta sistema buvo panaši į naudojamą automatiniam kalbos vertimui, tačiau, užuot išmokę sistemą versti iš vienos kalbos į kitą, mokslininkai išmokė ją versti vaizdus į sakinius.

Tyrėjai pasinaudojo „Amazon“ mechaniniu turku, kuris yra „miniatiūros“ rinka, kad samdytų darbuotojus parašyti sakinius, apibūdinančius scenas, sudarytas iš penkių ar daugiau nuotraukų. Iš viso darbuotojai aprašė daugiau nei 65 000 kompiuterinės sistemos nuotraukų. Šie darbuotojų aprašymai gali skirtis, todėl mokslininkai norėjo, kad sistema mokytųsi iš scenų, panašių į kitas tų scenų, pasakojimų. [A.I istorija: Dirbtinis intelektas (infografija)]

Tada mokslininkai pateikė savo sistemai daugiau nei 8 100 naujų vaizdų, kad ištirtų, kokias istorijas ji sukūrė. Pavyzdžiui, nors vaizdų fiksavimo programa gali padaryti penkis vaizdus ir pasakyti: „Tai yra šeimos nuotrauka; tai torto nuotrauka; tai yra šuns nuotrauka; tai yra paplūdimio nuotrauka“. Pasakojimo programa gali nufotografuoti tuos pačius vaizdus ir pasakyti: „Šeima susibūrė pasilinksminti; jie valgė daug skanaus maisto; šuo mielai ten viešėjo; jie puikiai praleido laiką paplūdimyje; net maudėsi vanduo."

Vienas iššūkis, su kuriuo susidūrė tyrėjai, buvo tai, kaip įvertinti, ar ši sistema buvo efektyvi kuriant istorijas. Geriausias ir patikimiausias būdas įvertinti pasakojimo kokybę yra žmogaus vertinimas, tačiau kompiuteris sugeneravo tūkstančius istorijų, kurių tyrimas žmonėms pareikalavo daug laiko ir pastangų.

Vietoj to, mokslininkai išbandė automatinius pasakojimo kokybės įvertinimo metodus, kad galėtų greitai įvertinti kompiuterio našumą. Atlikdami testus, jie sutelkė dėmesį į vieną automatizuotą metodą su vertinimais, kurie labiausiai atitiko žmogaus vertinimus. Jie nustatė, kad šis automatinis metodas įvertino pasakotoją kompiuteriu kaip ne tik žmonių, bet ir apie pasakotojus.

Viskas nuostabu

Vis dėlto kompiuterizuotam pasakotojui reikia daug daugiau pataikauti. „Automatinis vertinimas sako, kad jis veikia taip pat gerai arba geriau nei žmonės, bet jei iš tikrųjų žiūrėsite į tai, kas generuojama, tai yra daug blogiau nei į žmones“, - „Mitchell“ pasakojo „WordsSideKick.com“. "Labai daug nėra automatinės vertinimo metrikos, todėl reikia dar daug padirbėti. Šis darbas yra tvirta pradžia, bet tai tik pradžia."

Pavyzdžiui, sistema „retkarčiais„ haliucinuos “vaizdinius objektus, kurių nėra“, - teigė Mitchell. "Tai mokosi visų rūšių žodžių, tačiau gali neturėti aiškaus būdo atskirti juos. Taigi gali pamanyti, kad žodis reiškia tai, ko jis neturi, ir todėl [sakys], kad kažkas yra paveikslėlyje, kai jo nėra.. “

Be to, kompiuterizuotam pasakotojui reikia daug padirbėti nustatant, koks turėtų būti konkretus ar apibendrintas jo pasakojimas. Pavyzdžiui, pirminių bandymų metu „tiesiog buvo sakoma, kad viskas buvo nuostabu visą laiką - visi žmonės puikiai praleido laiką; visi turėjo nuostabų laiką; tai buvo puiki diena“, - teigė Mitchell. "Dabar galbūt tai tiesa, bet mes taip pat norime, kad sistema sutelktų dėmesį į tai, kas yra patrauklu".

Ateityje kompiuterizuotas pasakojimas galėtų padėti žmonėms automatiškai generuoti pasakų vaizdus, ​​kuriuos jie įkelia į socialinę žiniasklaidą, pasakas Mitchell. „Jūs padėtumėte žmonėms pasidalyti savo patirtimi ir sumažinsite niūrų darbą, kuris kai kuriems žmonėms atrodo gana nuobodus“, - sakė ji. Kompiuterizuotas pasakojimas „taip pat gali padėti žmonėms su regos negalia atverti vaizdus žmonėms, kurie jų nemato“.

Jei AI kada nors išmoks pasakoti istorijas pagal vaizdų sekas, „tai yra žingsnis link to paties padaryti ir vaizdo įrašams“, - teigė Mitchell. "Tai galėtų padėti pateikti įdomias programas. Pavyzdžiui, saugumo kameroms galite tiesiog pareikalauti dėmesio vertų dalykų santraukos arba automatiškai transliuoti tviterio įvykius", - sakė ji.

Šį mėnesį San Diege mokslininkai išsamiai aprašys savo išvadas Kompiuterinės kalbotyros asociacijos Šiaurės Amerikos skyriaus metiniame susitikime.

Originalus straipsnis apie gyvą mokslą.


Vaizdo Papildas: Zeitgeist: Judame Pirmyn (2011).




Tyrimas


Kaip Sužinoti, Ar Valgau Klonuotą Mėsą?
Kaip Sužinoti, Ar Valgau Klonuotą Mėsą?

Naujo Tipo Anglis Yra Kietesnė Ir Ryškesnė Nei Deimantai
Naujo Tipo Anglis Yra Kietesnė Ir Ryškesnė Nei Deimantai

Mokslas Naujienos


Kilauea Sako Riedulius Iš 5 Mylių Aukščio Išsiveržimo
Kilauea Sako Riedulius Iš 5 Mylių Aukščio Išsiveržimo

Kirmgraužos Galėtų Išmesti Keistus Šešėliai, Kuriuos Teleskopai Galėjo Įžvelgti
Kirmgraužos Galėtų Išmesti Keistus Šešėliai, Kuriuos Teleskopai Galėjo Įžvelgti

Nuotraukose: Kūdikių Rykliai Rodo Nuostabų Sugebėjimą
Nuotraukose: Kūdikių Rykliai Rodo Nuostabų Sugebėjimą

Nuotraukos: Katastrofiškos Žalos Oroville Spillway Dramatiški Vaizdai
Nuotraukos: Katastrofiškos Žalos Oroville Spillway Dramatiški Vaizdai

Beveik 50% Jav Tiki Medicinos Sąmokslo Teorijomis
Beveik 50% Jav Tiki Medicinos Sąmokslo Teorijomis


LT.WordsSideKick.com
Visos Teisės Saugomos!
Dauginti Jokių Medžiagų Leidžiama Tik Prostanovkoy Aktyvią Nuorodą Į Svetainę LT.WordsSideKick.com

© 2005–2020 LT.WordsSideKick.com