►► Ofertele continuă la: eMAG・Fashion Days・Finestore・Dyson・Flip. 📺 YouTube: youtube.com/NwraduBlog ◄◄
Iată încă un proiect foarte util: un computer a fost învățat să citească pe buze și o face cu o acuratețe pe 93%, în timp ce oamenii cu astfel de pregătire reușesc abia un 52% (aparent nu-i ca-n filme).
Computer este puțin zis, este de fapt o inteligentă artificială în sensul de acum, nu în cel din cărțile SF, adică un computer ce este antrenat să recunoască buzele nu prin programare clasică, sunet cu sunet, ci fiind expus la zeci de mii de înregistrări de clipuri video, putând astfel să facă o analiză a micilor deosebiri de acolo și să învețe diferențele.
Aplicațiile sunt enorm de multe și la fel de importante pentru digitalizarea informației precum scannerul de cărți pe care vi l-am arătat zilele trecute. Cu astfel de calculatoare performante, o mulțime de clipuri video ar putea avea și versiune text, indexabilă. Toate discursurile, vlogurile, TED Talks-urile șamd, fără nici un efort suplimentar. Ba mai mult, cu algoritmi suficient de buni computerul ar putea “scrie” subtitrarea pentru orice film, iar alți algoritmi de acest tip ar putea să o traducă în toate limbile.
Încă un exemplu: mă chinui de ceva vreme să găsesc un program de dictare în română, care să recunoască măcar parțial ceea ce-i zic, micșorând astfel timpul necesar scrierii acestor articole uriașe. Nu există unul bun. Dacă în loc de recunoașterea sunetului aș trece la recunoașterea mișcării buzelor?
Dar dacă aș vorbi față în față cu un chinez, eu având ceva ochelari tip Google Glass pe cap care-i analizează buzele, detectează ce-a zis și-mi rostește în ureche traducerea în română?
Gândiți-vă la treaba asta. Un translator universal nu mai este ceva demn de Star Trek, ci avem toate tehnologiile necesare pentru ce-am spus mai sus, trebuie doar rafinate și integrate.
Un proces asemănător de machine learning am înțeles că s-a făcut și pentru Kinect de la XboX, sistemul fiind expus la zeci de mii de fotografii cu diverse poziții și învățând de acolo să le recunoască. Vorbeam despre asta cu Silviu, cititor al blogului și de altfel cel care mi-a arătat știrea aceasta, și-mi spunea că procesul pare simplu pe hârtie, dar nu-i și în practică.
Analogia dată de el a fost cu metoda de a învăța un șofer nou să navigheze prin oraș. Dacă-l duci de 10 ori în același cartier, a învățat doar acel loc. Dacă-l duci în 10 locuri total diferite, nu învăță de fapt nimic. Secretul este să ai multe cazuri ce variază între ele suficient de mult pentru a învăța ceva, dar suficient de puțin pentru a învăța cu acuratețe. Să găsești banda aceasta ideală este destul de dificil și pot apărea erori. Altfel spus, cei care au învățat acel computer sa citească buzele ar fi putut ajunge, la final, la concluzia că au expus sistemul la un set greșit gândit de 28.000 de clipuri video și trebuie să o ia de la capăt.
Dacă vreți să vedeți cum învață un AI să recunoască forme, jucați-vă cu Quick, Draw de la Google.
sursa: Core77.
Vreți un avatar în comentarii? Mergeți pe gravatar.com (un serviciu Wordpress) și asociați o imagine cu adresa de email cu care comentați.
Dacă ați bifat să fiți anunțați prin email de noi comentarii sau posturi, veți primi inițial un email de confirmare. Dacă nu validați acolo alegerea, nu se va activa sistemul și după un timp nu veți mai primi nici alte emailuri
Comentariile nu se pot edita ulterior, așa că verificați ce ați scris. Dacă vreți să mai adăugați ceva, lăsați un nou comentariu.
9 comentarii
24/11/2016 la 8:05 AM
Pai de ce crezi ca a cumparat Microsoft pe Skype? Imediat dupa, au scos translatorul si traducatorul din diferite limbi…Skype dandu-le access la o baza de date imensa cu training seturi pentru algoritmii de ML
Octav(Citează)
24/11/2016 la 9:05 AM
din pacate lumea il invata prostii: http://i.imgur.com/ff1P6dl.png
altfel fun.
add(Citează)
24/11/2016 la 9:11 AM
Si milioane de traducatori si interpreti sa ramana fara obiectul muncii?!
Deea(Citează)
24/11/2016 la 11:39 AM
miliarde! sunt miliarde!
AI_core(Citează)
24/11/2016 la 2:41 PM
Și să încetinim tehnologia doar de dragul unor locuri de muncă? E tot mai faină viața în secolul 21 pentru că joburile sunt înlocuite de roboți și suntem nevoiți să evoluăm și să devenim mai relevanți în societate.
Gabi Miron(Citează)
25/11/2016 la 12:15 AM
@deea: stai fara grija traducatorilor. Actele traduse trebuie stampilate de un traducator autorizat de Ministerul Justitiei. Pana nu autorizeaza ministerul stampila translatorului google, traducatorii nu vor muri de foame. Deocamdata traducerile google sunt hilare. Mai au mult de munca.
david(Citează)
24/11/2016 la 12:45 PM
Dragon Dictation in limba romana merge foarte bine. Stiu cine isi dicteaza cursurile in limba romana pentru a le avea in format electronic.
:)
Din pacate, doar pentru produsele Apple.
Dan(Citează)
24/11/2016 la 2:45 PM
nu știu cum e pe Android dar pe io ies scrierea după dictare merge perfect
textul ăsta l’am dictat aifonului în notes.
observ că nu știe să pună virgula înainte de dar și în loc de ios a înțeles io ies.
a pus singur A la android.
AI_core(Citează)
26/11/2016 la 1:46 AM
O mică precizare, translatorul universal din Star Trek știa să traducă limbi necunoscute, adică se prindea/învăța singur; ca și teleportarea, tehnologia asta e încă departe :-)
alias(Citează)