Gépi tanulást segítő szoftver (2004)

Az Intel új, decemberben közzétett nyitott forráskódú szoftvere tapasztalataikból tanuló számítógépek létrehozására ad lehetőséget a fejlesztőknek. A programmal felerősített computer Bayes-féle statisztikai módszerrel, a múltbeli előfordulás alapján értékeli ki egy adott esemény jövőbeli valószínűségét.

Minél több adat áll a rendelkezésünkre, annál hatékonyabbak, pontosabbak a Bayes-féle matematikai elveken alapuló modellek. Amennyiben az adatok megváltoznak, a rendszer automatikusan korrigálja az eredményeket.

Proaktív számítógépek

„Az Intel arra törekszik, hogy a számítógépek proaktívabbak legyenek” – nyilatkozta David L. Tennenhouse kutatási igazgató, a cég technológiai csoportjának alelnöke. Ehhez viszont nélkülözhetetlen, hogy az adatgyűjtésben és a bonyolult elemzések kivitelezésében általában jól teljesítő gépek hasznosítsák a felhasználókkal, a környező világgal folytatott korábbi kommunikációjukat, képesek legyenek tanulni belőle. Az új statisztikai metódusok megadják a lehetőséget: a kulcsfontosságú minták beazonosításával, a rendszer idővel előrejelzi, mire van szüksége a felhasználónak. A legvalószínűbb kérdésekre pont akkor ad azonnal hozzáférhető választ, amikor kell, amikor az igény mutatkozik.

Tennenhouse nem kevesebbet vár az egyre gyorsabb mikroprocesszorokon futó szoftvertől, mint a gépi tanuláson nyugvó alkalmazások forradalmát, robbanásszerű elterjedésüket. Hasonlatként a gyerekek mozgására reagáló játékokat, valamint a biztonságunkat, produktivitásunkat fokozó vezeték nélküli szenzorhálózatokat említi.

A kutatásokat és a fejlesztéseket az Intel amerikai (Hillsboro, Santa Clara) oroszországi (Nyizsnij Novgorod) és kínai (Peking) laboratóriumaiban végezték. A szoftver a cég Nyitott Forráskódú Gépitanulás-könyvtárán (Open Source Machine Learning Library, OpenML) keresztül érhető el, a számítógépes látás és az audiovizuális beszédfelismerés (audio visual speech recognition, AVSR) melletti harmadik, valószínűségi hálózatokra vonatkozó (Probabilistic Network Library, PNL) szekcióban. Az OpenML rendeltetése a számítógépes intelligencia és az optimalizáló technikák mind szélesebb körű felhasználásának előmozdítása, begyorsítása.

pnl

 

A Bayes-féle módszerek felhasználását a mikroprocesszorok fejlődése, illetve az egyre tökéletesebb grafikus matematikai modellek biztosítják. Mindez azt eredményezi, hogy a gépi tanulás algoritmusokat szabványos PC-ken is futtathatjuk.

A Kaliforniai Egyetemen (Berkeley) dolgozó Michel I. Jordan professzor szerint az OpenML jelentős terjedelmű, gyors, megbízható programgyűjtemény, s nagy hasznára lesz a világ kutatóközösségeinek.

Alkalmazások

Az Intel fejlesztői (többek között) egy audiovizuális beszédfelismerő rendszer létrehozásával tesztelték az OpenML hatékonyságát. A rendszer lehetővé teszi, hogy a videokamerával ellátott számítógépek feltérképezzék a beszélő arcát, és nyomon kövessék szájmozgását. Az ajkakról történő olvasás elsajátítása az eddigieknél pontosabbá, hitelesebbé teszi a beszédfelismerést. Ráadásul zajos környezetben – bevásárlóközpontokban, repülőtéren – aligha (legalábbis egyelőre még nem) létezik megbízhatóbb módszer.

Igen tág az interaktív, indusztriális alkalmazási lehetőségek köre: az OpenML (és annak részeként, természetesen a PNL is) a nagy adatbázisok, az információfeldolgozás esetében tűnik ideálisnak. Máshol, így elektronikus levelezésünk kezelésekor szintén hatékony: miután megtanulta, majd modellezte szokásainkat, az új üzenetek menedzselését, például a dühítő és mind nagyobb mennyiségben érkező levélszemét kiszűrését önmagától képes elvégezni. De az MI-fejlesztéseknél (robotika, számítógépes játékok), ipari hibák elemzésekor, programok futásidejének optimalizálásakor ugyancsak számítanak rá.

Vagy az egyre fontosabb biotechnológiában, bioinformatikában: genetikai kutatásoknál, új gyógyszerekhez használandó „ígéretes” proteinek felismerése, azonosítása során, egymásba kapcsolva orvosi kémiát, biológiát, számítástudományt. A nagy mennyiségű információt gépi tanulást előmozdító eszközökkel, programokkal lehet legkönnyebben és leghatékonyabban a gyógyszer-feltalálási folyamatba integrálni.