A Microsoft a beszédfelismerés világbajnoka?
A Microsoft azt állítja, hogy egy jelentős teszteredménnyel hibaarány tekintetében beelőzte az IBM-et az embernél is jobb beszédértés gépekkel való megvalósításának versenyében, ahol rajtuk kívül még az Amazon, Apple és Google is játszik.
A Microsoft Research beszédtudós csapat új eredménye 6.3%-os szó hiba arány egy iparágban használt értékelési rendszer szerint. Az új technológia a Cortanát fogja erősíteni.
A korábbi legjobb a IBM Watson csapata volt 6.9%-kal, amely az előző saját rekordját nyolc százalékkal döntötte meg. (1995-ben is az IBM vezetett 43%-kal, amelyet a cég 2004-re 15.2%-ra javított.)
A Microsoft, az IBM és a Google szeptember közepén az Interspeech konferencián San Franciscoban dokumentumokat is mutatott a beszédfelismerési munkájuk részleteivel.
Napjainkban a korábbinál jóval nagyobb összegeket költenek a mesterséges idegi hálózatok kutatására, a technológiai óriáscégek bőven 10% alatti hibaarányokkal büszkélkednek, de még mindig nem haladják meg az emberi szintű pontosságot, amelyet az IBM kb. 4%-ra becsül.
Sundar Pichai a Google vezérigazgatója tavaly még azzal dicsekedett, hogy a mesterséges idegi hálózatok segítségével 8%-ra csökkentették az Android hang alapú keresésének alapját adó beszédfelismerési rendszerük hibaarányát.
Nemrég pedig az Apple Siri asszisztensének vezető képviselője Alex Acero (aki korábban a Microsoft Research csapatát erősítette) nyilatkozta, hogy a hangfelismerési hibaarányukat „minden nyelven a felére csökkentették”, esetenként nagyobb arányban, szintén a mesterséges idegi hálózatoknak köszönhetően. Még bátrabban fogalmazott az Apple szoftverfejlesztési alelnöke, Craig Federighi, aki szerint a Siri hibaaránya csak 5% az iparági sztenderd teszteken.
A Microsoft hangfelismerését az ún. NIST 2000 Switchboard feladaton tesztelték, amely egy 2000-ben indult, telefonbeszélgetés-alapú szövegértés értékelő rendszer.
Ezt a mérési módszert anno az SRI tecnológiájára alkalmazták. Ezt a céget vásárolta fel az Apple 2010-ben és alapul szolgált a Siri, a Dragon szoftver, az IBM és a BBN Technologies (utóbbit 2009-ben a Raytheon vásárolta fel) számára.
Versenytársaihoz hasonlóan a Microsoft a mesterséges intelligenciát helyezte az ember és számítógép közötti interakciós stratégiájának középpontjába, olyan hangalapú platformokkal, mint a Cortana, amelyek egyre inkább kulcsszerepet játszanak a hordozható okos eszközök, mobilok, otthonok, járművek és vállalatok intelligensebbé tételében.
Forrás: ZDNet.
További érdekességekért keresse fel rendszergazda blogunkat!