AlphaGo
AlphaGo on Google DeepMindin kehittämä tietokoneohjelma, joka pelaa Go-lautapeliä. Lokakuussa 2015 siitä tuli ensimmäinen tietokone-go-ohjelma, joka on voittanut ammattilaispelaajan ilman tasoituskiviä täysikokoisella 19x19-pelilaudalla.[1] Maaliskuussa 2016 se voitti kolme ensimmäistä peliä viiden pelin ottelussa Lee Sedolia vastaan[2] ja siten koko ottelusarjan. Kokonaisuutena sarja päättyi lopulta 4–1. Kyseessä on ensimmäinen kerta, kun go-ohjelma on voittanut 9-dan-tasoisen ammattilaispelaajan ilman tasoituskiviä.[3]
AlphaGon algoritmi on yhdistelmä koneoppimisesta ja puuhausta sekä harjoittelusta ihmis- ja konepelaajia vastaan. Se käyttää Monte Carlon puuhakua, jota ohjaa ”arviointiverkko” (engl. value network) ja ”toimintamalliverkko” (engl. policy network). Toimintamalliverkko suosittelee erilaisia pelitapoja, joista seuraavia pelitilanteita arviointiverkko arvioi. Lopulta AlphaGo valitsee pelitavan, joka on sen simulaatiossa menestyksekkäin.[1]
AlphaGon Leen voittaneesta versiosta ei ole kerrottu kovinkaan paljoa julkisuudessa. Aalto-yliopiston tietotekniikan laitoksen apulaisprofessorin Tapani Raikon mukaan ohjelma oli vuotta aiemmin vahvan harrastajan tasolla, ja lokakuisenkin version Lee olisi päihittänyt vielä helposti.[4]
Kilpailut
[muokkaa | muokkaa wikitekstiä]Ottelu Lee Sedolia vastaan
[muokkaa | muokkaa wikitekstiä]AlphaGo pelasi eteläkorealaista 9-danin tasoista go-pelaajaa Lee Sedolia vastaan Soulissa Etelä-Koreassa viiden ottelun sarjan 9., 10., 12., 13. ja 15. maaliskuuta 2016.[5] AlphaGo voitti peleistä neljä ja Lee yhden (neljännen).[6] AlphaGon puolesta kivet sijoitti laudalle Aja Huang, joka on osa DeepMind-tiimiä ja itsekin 6-dan-tasoinen go-pelaaja.[7] AlphaGon ohjelma ajettiin pilvessä Googlen palvelimilta Yhdysvalloista. Pelit pelattiin kiinalaisilla säännöillä 7,5 pisteen komilla, ja kummallakin pelaajalla oli kaksi tuntia aikaa miettiä siirtojaan sekä kolme 60 sekunnin byoyomi-aikajaksoa.[8] Ottelusarjan voittaja sai palkinnoksi miljoona dollaria.[9]
Kolmannen pelin jälkeen Leen entinen valmentaja Kwon Kap-Yong sanoi, että AlphaGo pelasi johdonmukaisesti alusta loppuun, kun taas Lee osoitti jonkin verran henkistä haavoittuvaisuutta.[2] Toisaalta pelin asiantuntijoiden mukaan AlphaGo teki epätavallisia ja alkuun kyseenalaisia siirtoja, mutta joissa oli kuitenkin jälkeenpäin ajateltuna järkeä.[2] Alkujaan odotettiin, ettei ohjelmasta olisi vastustusta Leelle. Myös DeepMindin perustajajäsen Denis Hassibis oli yllättynyt ohjelman voitosta.[6]
Katso myös
[muokkaa | muokkaa wikitekstiä]- Deep Blue - Shakin ykkösihmisen voittanut tietokone.
Lähteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b AlphaGo: Mastering the ancient game of Go with Machine Learning Google Research Blog. 27.1.2016. Google. Viitattu 10.3.2016. (englanniksi)
- ↑ a b c Tekoäly päihitti jälleen ihmisen – go-suurmestari hävisi kolme peliä peräkkäin Yle Uutiset. Viitattu 12.3.2016.
- ↑ Byford, Sam: Google's DeepMind beats Lee Se-dol again to go 2-0 up in historic Go series The Verge. 10.3.2016. Viitattu 10.3.2016. (englanniksi)
- ↑ Go-mestarin tappio koneelle tärkeä merkkipaalu – tekoäly valloittaa vähitellen arkeamme Yle Uutiset. Viitattu 17.3.2016.
- ↑ Gibbs, Samuel: Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast The Guardian. 5.2.2016. Viitattu 13.3.2016.
- ↑ a b Eloranta, Ville: Lautapelimestari ylsi ensimmäiseen voittoonsa Googlen tekoälyohjelmasta – takana kolme tappiota HS.fi. 13.3.2016. Viitattu 13.3.2016.
- ↑ 李世乭:即使Alpha Go得到升级也一样能赢 JoongAng Ilbo. Viitattu 13.3.2016. (kiinaksi)
- ↑ 이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려 baduk.or.kr. Arkistoitu 3.3.2016. Viitattu 13.3.2016. (koreaksi)
- ↑ Google’s AI beats world Go champion in first of five matches BBC Online. 9.3.2016. Viitattu 10.3.2016. (englanniksi)
Aiheesta muualla
[muokkaa | muokkaa wikitekstiä]- Virallinen kotisivu (Arkistoitu – Internet Archive) (englanniksi)
Pelit Lee Sedolia vastaan
[muokkaa | muokkaa wikitekstiä]- Peli 1 (15 minuutin yhteenveto) (englanniksi)
- Peli 2 (15 minuutin yhteenveto) (englanniksi)
- Peli 3 (15 minuutin yhteenveto) (englanniksi)
- Peli 4 (15 minuutin yhteenveto) (englanniksi)
- Peli 5 (tulossa) (englanniksi)