Ştiri:

Vă rugăm să citiţi Regulamentul de utilizare a forumului Scientia în secţiunea intitulată "Regulamentul de utilizare a forumului. CITEŞTE-L!".

Main Menu

De ce credeti ca softurile de traducere automata nu devin mai performante?

Creat de morpheus, Martie 31, 2011, 02:16:50 PM

« precedentul - următorul »

0 Membri şi 1 Vizitator vizualizează acest subiect.

morpheus

Pentru mine constituie o oarecare dezamagire sa constat ca desi trec anii, softuri precum cele de la Google Translate ori Yahoo Babelfish nu progreseaza din punct de vedere al acuratetii traducerilor.

Nu ma pricep la domeniu, dar as fi curios sa aflu de la cineva care a studiat cat de cat problema cam unde apar limitarile. Ce e cel mai anevoios? De translatat o gramatica in alta? De adaptat expresiile idiomatice? De tradus proverbe si ziceri speciale?

Ori pur si simplu nu se investesc suficient de multi bani in treaba asta?

Am citit la un moment dat ca Noam Chomsky ar fi avut ceva legatura cu domeniul, dar nu cunosc detalii. Stie cineva in ce au constat si pana unde au mers cercetarile acestuia?

Stiti cumva daca exista softuri comerciale care sa realizeze traduceri de calitate dintr-o limba in alta?

Oare limbile orientale (chineza, japoneza) ori araba se preteaza mai bine la un asemenea task?
Cu momentul în care ne naştem, timpul începe să ne ia viaţa înapoi. (Seneca)

tavy

Citat din: morpheus din Martie 31, 2011, 02:16:50 PM
Pentru mine constituie o oarecare dezamagire sa constat ca desi trec anii, softuri precum cele de la Google Translate ori Yahoo Babelfish nu progreseaza din punct de vedere al acuratetii traducerilor.
Eu chiar mă miram cât de mult a progresat translatorul de la Google în ultimul an.
Trebuie să te gândești că relativ de curând se pune problema ca un calculator să facă o traducere bună, eu nu am impresia că se înaintează greu.
Traducerile nu sunt chestiuni exacte, de multe ori sunt subiective și de multe ori nu se pot face sau dau aberații mari dacă sunt scoase din context. Din acest motiv, la traduceri se pretează mai bine rețelele neuronale în dezavantajul calculului algoritmic. O rețea neuronală, pe lângă puterea de calcul mare care o necesită, trebuie însă antrenată și asta durează.

morpheus

Citat din: tavy din Martie 31, 2011, 09:03:49 PM
Din acest motiv, la traduceri se pretează mai bine rețelele neuronale în dezavantajul calculului algoritmic.

Poti sa imi spui pe scurt cam care sunt diferentele dintre retele neuronale si calcul algoritmic?
Te referi cumva la faptul ca in cazul translatoarelor online acestea reactioneaza in timp in urma inputurilor venite de la useri? Adica incep sa foloseasca in cadrul traducerilor variantele de traducere oferite cel mai des de utilizatori? Caci daca despre asta e vorba, eu sunt cam pesimist. Nu cred ca stau prea multi sa sugereze traduceri mai bune ptr. anumite cuvinte ori expresii translatorului de la Google.

Oamenii au defectul major ca vor totul de-a gata. Iau ce li se ofera si mai modifica ei pe alocuri, fara a le mai pasa de optimizarea softului de traducere...

Altfel, eu nu stiu nimic despre retelele neuronale. Sa inteleg ca pot fi scoase in afara calculului algoritmic?
Exista si altfel de programe de computer decat cele care urmeaza o schema logica?
Ori e vorba de algoritmi + invatare?
Cu momentul în care ne naştem, timpul începe să ne ia viaţa înapoi. (Seneca)

tavy

Din păcate și eu știu destul de puține despre rețelele neuronale, am făcut un curs introductiv de un semestru acum mai bine de 15 ani. Dacă m-aș apuca să-ți vorbesc eu despre rețele neuronale, cu puținele mele cunoștințe este foarte probabil mai mult să te încurc.
Ideea este că o rețea neuronală poate fi simulată pe un calculator, cu ajutorul algoritmilor, doar că algoritmii nu fac decât să modifice parametrii ai rețelei neuronale și să simuleze funcționarea ,,neuronilor" individuali.
În general softurile de traducere folosesc sugestiile date de utilizatori.
Pe de altă parte rețelele neuronale nu sunt foarte sigure, îmi aduc aminte de o întâmplare povestită de profesor la cursul de ,,fractali și rețele neuronale": ,,Niște cercetători au antrenat o rețea neuronală să recunoască fotografiile care conțin tancuri, după o vreme au ajuns ca rețeaua neuronală să dea rezultate foarte sigure. În momentul când a fost pusă efectiv la treabă rețeaua, dezastru, dădea foarte multe rateuri. Au investigat și au ajuns la concluzia că, în faza de instruire rețeaua a primit totdeauna fotografii cu tancuri făcute primăvara iar celelalte în alte anotimpuri. Fără să realizeze, cercetătorii au antrenat rețeaua să recunoască dacă o fotografie era făcută primăvara.". Nu știu cât de reală este întâmplarea.
Probabil, dacă chiar te interesează domeniul, poți găsi destulă informație pe Internet.

Adi

Eu folosesc o retea neuronala in cercetarea mea pentru a separa evenimentele de boson Higgs de evenimentele care seamana cu bosonul Higgs, dar sunt fenomene deja cunoscute din Modelul Standard. Insa nu am apucat insa sa antrenez (train) eu inca o retea neuronala. Abia astept insa. Intr-adevar, este o metoda de a invata sa separe doua clase de obiecte. Dar nu are creier, ci doar deosebeste pe baza unor proprietati. Important e sa aiba exemple corecte dupa care sa invete.
Pagina personala: http://adrianbuzatu.ro

AlexandruLazar

Sunt foarte multe motive pentru care progresul pare lent. Mi-e greu să fac o analiză prea bună pentru că nu e domeniul meu, dar vreau numai să dau doua exemple:

a) Contextul. E foarte greu de diferențiat sensul unui cuvânt, între două limbi diferite, atunci când vine vorba de a le traduce. De exemplu, "fair" poate însemna la fel de bine și târg, și bâlci, și profesionist (ca în "fair play"). Traducerea presupune înțelegere contextului în ambele limbi. Problema însă devine și mai complicată atunci când sunt implicate expresii verbale.

Asta nu e totdeauna banal: "Are you going to Scarborough Fair?" este foarte ușor tradus ca "Ai de gând să echitabil Scarborough?"

Traducerea pare absurdă dar în cazul de față, motorul pur și simplu nu știe că Scarborough e un oraș și crede că e un verb (i.e. ca de exemplu în "are you going to play fair?"), astfel că traducerea de fapt e cât se poate de corectă. Asta pentru că de fapt "Scarborough fair" e doar un bâlci foarte cunoscut, altfel s-ar spune pur și simplu "Are you going to the fair in Scarborough?", pe care îl traduce foarte bine ca "Te duci la târg în Scarborough?"

La prima vedere treaba s-ar rezolva foarte ușor dacă programul ar putea fi făcut să înțeleagă că "Scarborough fair" e un bâlci, dar cum îl faci pe urmă să traducă corect "Te duci la bâlciul din Scarborough" în "Are you going to Scaroborough Fair?". Fără îndoială, în Scarborough nu există un singur bâlci tot anul -- e vorba de cel faimos care se ține acolo încă din Evul Mediu, sau de târgul de vechituri de sâmbătă dimineață?

Problema în cazul de față este că nu toate limbile garantează existența diverselor contexte, pentru că limbajul, așa cum îl folosim pentru comunicare, nu include numai gramatică și semantică, ci și un întreg bagaj cultural care nu e ușor de transmis.

Și mai rău, ce te faci când e vorba de așteptări diferite? Cum a fost recent cu faimosul "lame duck" al americanilor -- asta pune probleme și oamenilor, cu atât mai mult calculatoarelor.

b) Ironia. Eu cred că n-o să poată fi niciodată reprodusă ;D. Chestia asta am văzut-o "pe bune" anul trecut. Discutam cu un coleg care se ocupă de așa ceva și unul din multele teste pe care le-a făcut pentru a vedea cât de bine înțelege expresiile și locuțiunile a fost pe un articol care vorbea despre una din iubirile din tinerețe ale viitorului rege al nu-știu-cărui stat. Omul il luase cautand dupa expresia "queen-sized bed" și luase la plezneală 10-15 fragmente conținând expresia asta.

Evident, așteptarea era ca traducerea să fie "pat matrimonial" -- totuși formularea respectivă era de tipul "Cutărescu's bed proved to be the actual queen-sized bed". în cazul de față, traducerea corectă chiar era "patul de dimensiunea reginei", în sensul că s-a dovedit să fie chiar patul potrivit pentru respectiva persoană.