GOOGLES KUNSTIGE INTELLIGENS 'ALPHA GO ZERO' TRYKKTE BARE PÅ RESET OM HVORDAN DU LÆRER

Husk (vagt) hvordan du lærte å gå, snakke, sykle eller kjøre? Det var rotete og fullt av feil, men ferdighetene du lærte på den måten ble værende. Utenfor levende systemer har det vært utfordrende å strukturere sterke nok algoritmer til å ta i seg 'virkelige livserfaringer' og utvikle klissete, tilpasningsdyktige atferd for kunstig intelligens.

Vel, Alpha Go Zero gjorde det bare.

'Det starter fra et tomt skifer og finner ut bare for seg selv, bare fra selvspill og uten menneskelig kunnskap, eller menneskelige data, funksjoner, eksempler eller intervensjon fra mennesker. Den oppdager hvordan man spiller Go fra de første prinsippene, sier DeepMinds professor David Silver.

AI har hatt flere iterasjoner, hver smartere og mer i stand enn den før. Den forrige versjonen brukte en enorm database med tidligere spill sammen med en rekke algoritmer som pekte den mot å vinne. Denne tilnærmingen førte til nederlaget til den regjerende verdensmesteren profesjonelle Go-spiller. I poker skinnet AI Libratus nylig verdens beste pokerspillere med nesten 2 millioner dollar, også ved å lære gjennom selvspill i stedet for menneskelige spilldata.

hvor høy er william levy

Nå, i denne siste versjonen av Alpha Go, lærte programmet for kunstig intelligens seg selv hvordan du spiller Go - uten menneskelig bakgrunn.

Det kjørte millioner av spillsimuleringer mot seg selv, og det tok 40 dager for det å lære - fra bunnen av - hvordan å slå verdensmesteren. Det er virkelig skiftende spill, ikke bare for Go, men også for hvordan ny kunnskap blir oppdaget. Hvor nøyaktig eller komplett er domenekompetansen din? Det er mye mer å oppdage, er hva dette fascinerende eksperimentet med å lære med Alpha Go Zero forteller oss.

'Ideen med Alpha Go er ikke å gå ut og beseire mennesker, men faktisk å oppdage hva det betyr å gjøre vitenskap - for et program som skal kunne lære av seg selv hva kunnskap er,' ifølge Silver i et YouTube-innlegg om prestasjonen.

Alpha Go Zero Deep Mind-teamet kaller det førsteprinsippet, 'tabula rasa' (blank skifer) læring.

'Hvis du kan oppnå tabula rasa når du lærer, har du en agent som kan transplanteres fra spillet Gå til et hvilket som helst annet domene, og detaljene i spillet du er i, du kommer opp med en algoritme som er så generell at den kan brukes hvor som helst, 'sier han . Det er en provoserende idé når du utvider konseptet. Tenk bare hva vi kunne gjøre med et sett med sterke læringsalgoritmer som systematisk kunne takle tøffe problemer og lære raskere enn vår sivilisasjons kollektive kunnskap. . . i dager, ikke tiår.

hvor gammel er brennan elliott

Foreløpig er den store take away, 'algoritmer betyr mye mer enn databehandling eller tilgjengelige data,' sa Silver. Dette alene er en spillveksler i hvordan vi nærmer oss å utvide den kjente verdenen. Mens Alpha Go kjører på rundt 25 millioner dollar i maskinvare - det er ikke akkurat et lett system - vet du at AI-guruer lenge har jobbet med å lage renere, bedre datasett. I dag anses mange store datasett for støyende - fulle av dårlige data - til å trene en kunstig intelligens nøyaktig. Hvis AI lærer av data, og dataene er dårlige, lærer det ikke. Stort problem.

Hva om du ikke trengte rene data, men bare erfaring, og kunstig intelligens kunne trene seg selv?

Det er den spennende prestasjonen i Alpha Go Zero. Selv om det er i den nisje, regelbaserte spillverdenen, har det store implikasjoner i alle bransjer som arbeider ut fra fysiske regler - tenk kjemi, trafikk, biologi, farmakologi, reise, logistikk og produksjon. Hvis vi kan designe regler så fleksible at de kan arbeide ut fra bredere erfaring, og så retningsbestemte at de alltid skaper sterkere ferdigheter - som Alpha Go Zero - så er det mulig å oppnå kunstig intelligens som hjernenes systemer. Disse systemene trenger ingen data utenfor, har ingen data rensing problemer, og trenger ingen menneskelig-i-løkken nedgang. Det er delvis grunnen til at Googles morselskap, Alphabet, satser selskapet på kunstig intelligens og investerer i kunstig intelligens i rask hastighet. (Amazon investerer også i kunstig intelligens, i likhet med det siste AI-anskaffelsen BodyLabs.)

jack gleeson reign of fire

Deep Mind-professor David Silver sier: 'Det faktum at vi har sett et program oppnå ytelse på høyt nivå ... burde bety at vi nå kan begynne å takle noen av de mest utfordrende og virkningsfulle problemene for menneskeheten.'

Dette innlegget er oppdatert for å avklare at AI Libratus nylig slo de beste pokerspillerne ved å bruke en strategi som involverer selvspill i stedet for data fra mennesker.