A Google hamarosan magyarra is lefordítja a webet

Ha minden igaz, a Google törleszti a magyar felhasználók felé eddigi legnagyobb adósságát. A GOS blog szerint hamarosan 7 új nyelvvel bővül a Google online fordítóprogramja, a Google Translate. A jó hír pedig, hogy ebbe a körbe - az albán, az észt, a gallego, a máltai, a thai és a török mellett - végre a magyar is bekerült.

A fejlesztés azért fontos, mert a várt frissítés után azok is olvashatják a világ 43 nyelvén íródott weboldalakat, akik nem beszélnek az adott nyelven. Másként szólva: hamarosan az egész webet magyar nyersfordításban is követhetik a netezők.

De például automatikus magyar nyersfordításban olvashatjuk majd a Google Reader segítségével a világ különféle nyelvein íródott hírforrásait is. (Nehéz idők várnak a magyar webes fordítóprogramokra.)

Bár a Google fordítóprogramjának angol változata meglehetősen jó minőségű, azért nyilván sok nevetésre fognak okot adni az automatikusan magyarra "nyersfordított" online szövegek.

Hozzá kell tenni, hogy a Google fordítószoftvere statisztikai alapon működik. Ezért a magyar fordítások akkor lesznek egyre jobb minőségűek, ha a magyarok is elkezdenek nagy mennyiségben feltölteni a webre kétnyelvű szövegeket. Erről egyébként külön értesíteni is lehet a Google-t.

Azt egyelőre nem tudni pontosan, hogy mikor frissül a hét új nyelvvel a Translate.

A másik fontos újítás, hogy a Translate angol szótára várhatóan szinonimákkal, antonímákkal (ellentétes értelmű szavakkal), kiejtési mutatóval és részletes szómagyarázattal is bővül.

Címkék: google fordítóprogram google translate
2009.01.31. 21:46. írta: hírbehozó

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Azért kíváncsi leszek milyen magyar lesz :D
Remélem a "már érthető" kategória.
És magyar oldalakat angolra fog-e fordítani?
nehez lesz magyarra nyersforditani
hulye egy nyelv sajna
remelem hasznalhato lesz
szerintem épp ez a késés oka: túl bonyolult nyelvünk van, legalábbis az angol szemszögéből nézve, és nincs akkora mennyiségű anyagunk a neten, mint például a hasonlóan bonyolult kínai nyelvnek, amiből az izomerőn alapuló statisztikai nyelvészeti logaritmusok használható eredményt gyárthatnának.

Nem sok reményt táplálok iránta, de majd meglátjuk
No, ez egy érdekes hír. Valószínűnek tartom, hogy valamelyik már létező online fordító adta el magát a Google-nek, és azt is, hogy az nem a MorphoLogic volt, mivel annak igencsak jól megy a webforditas.hu oldala, mi szüksége lenne neki erre.

Szal valszeg a Dativus lehetett az. Azt a webforditas.hu azért - azt mondanám, elsősorban a sok nyelvpár miatt - veri kicsit.

Azt is megjegyezném, eléggé inkorrekt az állítás, hogy ne lehetne olvasni a webet minden nyelvről magyarra, hiszen a webforditas pont ezt teszi már egy jó ideje. Szóval miről is van szó itten, kérem?

Annak meg inkább nem tapsikolnék, hogy egy multi izomból lenyomja a kevés talpon maradt magyar K&F cégek egyikét... mi a fenének teszi? Mitől fáj neki ez a kicsi piac? Azt nem veszitek észre, ha most tönkrevágják a magyar kutatóműhelyeket, akkor nem csak annyi kellemetlenségetek lesz, hogy a guglin kívül kell neteljetek "más nyelveken", de nem lesznek szótövesítők, modern nyelvtechnológiai eszközök, nem lesz műhely, aki erre az igen sajátos nyelvre szabná a világot (nem csak a webet).

Szar ügy. Magyarország élen járt a nyelvtechnológiában, az élmezőnyben volt Európában, Amerikában egyaránt. Ezt sokan a magyar nyelv sajátos tulajdonságainak tudták be (állatira produktív, ragozó nyelv, ezért a legtöbb nyelvi jelenség megtalálható benne, ami más természetes nyelveken is). Sajna, ez a kurva nagy előny mára elolvadt. Idén harmadik éve, hogy nem írtak ki egyetlen K&F pályázatot sem a szektornak.

Szóval csak nem tapsikolni annyira veszettül.

Egyébként meg még az is előfordulhat, hogy egy hírhedt automatikus (f)ordítással foglalkozó amerikai cég termékével van dolgunk, ammeg elég humoros eredményeket hoz majd.
messze van ez még a szemantikus webtől, a fordítóprogramokat nem temetném, a mennyiségi célt most értük el [ez volt a könnyebbik szakasz ] most a minőségi cél jön.
"az albán, az észt, a gallego, a máltai, a thai és a török mellett - a magyar is bekerült."

hehe micsoda társasággal kerülünk be:D

@alphanumericus: "Azt a webforditas.hu azért - azt mondanám, elsősorban a sok nyelvpár miatt - veri kicsit."

"hogy ne lehetne olvasni a webet minden nyelvről magyarra, hiszen a webforditas pont ezt teszi már egy jó ideje"

így gondolod? ezt nézzed meg tomkeller.blog.hu/2009/01/30/en_fureszeltem_az_arceledet

webforditas.hu mindent csinál csak magyarra nem fordít:D
alphanumericus
Ez az, sírd tele a zsebkendőd, te vagy a tipikus: semminek sem tud örülni.
Hát a Morphologic nem túl jól fordít angolról magyarra (és viszont), sokszor elég érthetetlen. De kell a munkámhoz, majd kivácsi leszek a Google programjára.
a sok b..f.sz kulfoldinek fordito kell, h ertsen magyarul (tudom az cikk angol------>magyarrol szol). pedig a legkonnyebb nyelv, allitom! :)
aki viszont nem tud angolul, igy is ugy is megszivta! :)

Egy szónál kaptam fel a fejem: automatikus.

Nem annyira örülnék annak, hogyha automatice magyarul jelenne meg egy angol nyelvű feedem.
@meszi: Az a gond, hogy ez nem is a webfordítással készült, az azért értelmesebb szöveget dob ki (bár még mindig nem a legjobb...) Üsd csak be az eredeti szöveget a webfordításba :)
@alphanumericus: Tudtommal saját viszonylag univerzális nyelvtanuló MI-t írt a google, azt igazítgatja különböző nyelvekhez.
@Tschöppy: Ha jól emlékszem ez egy ki/bekapcsolható opció.
Miben is különbözik ez a webfordítás.hu-tól?
meszi: angolt tesz angolul nem beszélőknek érthetővé. ennél többet senki más sem fog tenni, ebben biztos lehetsz... egyébként a fordítandó szöveg állatira gyatra, de ennek ellenére teljes mértékben igazad van! jó lenne, ha egy webes fordítóeszköz rendelkezne olyan szolgáltatással, ami az "élőírást", azaz a chatet, rövid emailt stb. is fordítja. Teoretikusan abszolút lehetséges lenne egy spec. lexikonnal dolgozni, ami az ilyen hülyeségeket is tartalmazza, mint az "I saw your profile" webes profil értelemben, vagy tudná, mit tegyen, ha elgépel valaki valamit (remeber, alot, stb.), sőt, akár külön lexikonnal is rendelkezhetne IT-s szövegekre, autóiparra, marketingre, pénzügyre, vagy akár a szex chatre! Ezek közül szerintem sok dolgot képesek lennének megoldani Dativusék és Morfóék már most is, csak hát gondolj bele, mennyi munka...

tutis: telesírom én a te zsebkendődet is, ha nem érted meg, amit mondok, hékás :)

Elsősorban nem a gugli a gond (bár hajaj...), hanem a "híres magyar nobel-díjasaink"-jelenség: itt van a szürkeállomány (még), van közel egy tucat jobbnál jobb nyelvtechnológiai műhely, osztán kőröshegyi lánchíd. Három éve azokat a K&F pályázatokat sem írják ki, amikre ott az ajró a pénztárban. Aztán ha kihúznak a lelkes kutatók, Amerikába, Charles Simonyik lesznek, akkor meg "büszke kis hazánk gyermeke a zúrben". Éééérteeed már?

peca100: nem fordítás ez, igazándiból, hanem (figyelem!) MEGÉRTÉSTÁMOGATÁS...

Nem csinál mást, nem is jó másra, mint arra, hogy ad valami fogalmat a szöveg körül-belüli jelentéséről.

de az hülyén nézne ki, ha így hívnák, a mélyen tisztelt publikum nem venné a lapot, ugye. hiszen az mindent megért... :)
Érdekes, hogy csak a lényegről nem esik szó, hogy a Google Translate tud tanulni, azaz, nem kis részben rajtunk múlik az, hogy mikor lesz a fordítás minősége elég jó. Hogy a Gugli nem csak egy meglévő megoldást vett meg, hanem komolyabban ráállt a dologra, az is mutatja, hogy a magyart már legalább fél éve, de lehet, hogy régebb óta felismeri, csak valszeg nem ért el egy bizonyos szintet.

@alphanumericus: Remélem jó ideig még nem is írnak ki ilyen pályázatot, mert amit én ebből láttam, abból azt a következtetést vontam le, hogy valaki vagy pályázik, vagy dolgozik, a zsé tetemes részét meg az egyébként semmit nem kockáztató pályázatírók nyúlják le.
bbandi: jól hangzik, kétségtelen. de valahogy nehéz elképzelnem, hogy natív intelligencia nélkül megbirkózik majd olyan aglutináló nyelvekkel, mint pl. a török vagy a magyar... azért ahhoz, hogy tanuljon, még egy MI-nak is le kellene elemezgetni a mondatot, a keresési művelethez pedig nyilván nem elég a szólista, generálni és szótövesíteni is kell, ahhoz meg nyelvész kell, az meg honnan?

de állatira fúrja az oldalamat, ANNYIRA szeretném tudni, mit is értenek nyelvtanuló MI alatt... pláne török-magyar kontextusban.
@KGyST: nem egészen értem, mi ez a végtelen fásultság, a dögöljön meg a tehened-életérzés? miért rossz neked, ha nem pártkampányra megy a közpénz, hanem kutatás-fejlesztésre?

á, mindegy, hagyd el, nem érdemes...
a google honlapján le van írva, hogy elsősorban abból táplálkozik a dolog, hogy van egy csomó lefordított szövege, megkeresi az általad keresett dolgot benne és kiadja. minden más erre épül, meg persze van valamennyi mennyiségű szótára is. egyebet nem tudok mondani, kérem kapcsolja ki.
Helyesen: "antonímákkal", nem "antonímiákkal".

Amúgy meg:
- Mi az az antoníma?
- A szinoníma antonímája.
"Valószínűnek tartom, hogy valamelyik már létező online fordító adta el magát a Google-nek, és azt is, hogy az nem a MorphoLogic volt, mivel annak igencsak jól megy a webforditas.hu oldala"

De rögtön szarul fog neki menni, amint a google lefordítja az oldalakat magyarra, szóval nem hinném, hogy ez egy jó érv lenne.
jo sokat erolkodhetnek rajta, es nem lesz tokeletes..
de megis mi a fenenek?
miert nem kepesek inkabb a magyarok megtanulni angolul? mar azt sem ertettem, hogy nalunk miert nincsenek a tv-ben feliratos filmek, hogy aki akar, az se tanulhasson/gyakorolhasson nyelveket?
nem eleg hogy hulyek, tanulatlanok vagyunk, azok is akarunk maradni?
Ez jó hír, kíváncsian várom :)
Nemhinném, hogy valamelyik magyar fordító adta volna el magát. A GT máshogy működik, statisztikai elven fordít, és azért kellett ennyit várni rá mert kevés a magyar-angol tükörszöveg amit elemzhet, ami persze a minőség rovására is mehet, de egyre jobb lesz majd. Másrészt viszont a magyar nyelv furcsaágai szerintem pont segítenek. A számtalan kivétel, egyedi szófordulat sokkal inkább kedvezhet a statisztikai elemzésnek mint eg yolyan nyel ahol pl a "que" szónak van vagy 150 jentése.
@petbecks: attól, hogy a magyarok megtanulnak angolul, a magyar szöveget még néha szeretné megérteni egy nem magyar. A dán-angol fordítás sem csak azért jó, hogy a dánok értsék az angolt (mert ők többségében értik), hanem azért is, hogy én megértsem a dán szöveget az angol segítségével.
én is örülök a lehetőségek bővülésének, szeretettel várom a fordítót.
egyébként van egy ehhez hasonló projekt már:
szotar.mokk.bme.hu/hunglish/search/corpus
bár ez nem "tanul"

(szívesen várok angol-magyar, m-a egyéb fordító szolgáltatásokat, amik használhatók is, linkeljétek be légyszi)
Egyébként én például a webforditas.hu-t semmire nem tudtam használni, az angolban nekem két segítségem van: a MobiMouse, és a Hunglish korpusz ( szotar.mokk.bme.hu/hunglish/search/corpus ). Plusz a logikus józan ész, ami az automatikus fordítókban a magyar nyelv esetében nincs jelen. Ami működik pl. német-angol, vagy dán-angol viszonylatban, az a magyar esetében egyelőre teljesen reménytelen. Én egyébként a mesterséges intelligencia szabványos tesztelésére a magyar nyelv megértésének képességét alkalmaznám a jövőben. :)
@tib i: előbb-utóbb biztos megérzik, de kérdés, hogy a webfordítást használók mennyire ismerik a translate-et?

lehet, hogy én gondolom rosszul, de szerintem az átlag magyar netezők a keresőn, gmail-en és a youtube-on kívül (esetleg még chrome és blogger) nem igazán ismerik a google szolgáltatásait
@ldavid: ezt a googlenél úgy fogalmaznák, hogy igen fejlődőképes piac :)
Szerintem az átlag magyar netező a webfordítást sem ismeri:)
"a google honlapján le van írva, hogy elsősorban abból táplálkozik a dolog, hogy van egy csomó lefordított szövege, megkeresi az általad keresett dolgot benne és kiadja"

Ha pl. érdekel valami a LifeHacker-ről, és olyan szerencsés vagy, hogy már vagy két napja felkerült a cikk, akkor egyszerűen átirányít valamelyik magyar blogra, ott már úgy is meg van magyarul a másolat.
Így tényleg csak egy gyors statisztikai elemzés, kb. egyezik, mehet. :-)
Korábban volt egy interjú a fejlesztés vezetőjével a BBC-n, azt hiszem vagy német vagy valamelyik észak-európai országból származik és mondta, hogy a nyelvészeti szempontok helyett a statisztikát helyezik előtérbe és a fejlesztésnél a fő forrásuk az EU dokumentumai, mert ott ugye profi fordítókkal(tehát igényesen) mindent lefordítanak az unió minden tagországának nyelvére és fel is pakolják a netre, így gyakorlatilag ingyen egy valóságos kincsesbánya áll a rendelkezésükre.

Meg szóba került itt a sok külföldre szakadt hazánkfia is, hát nemcsak a Word/Excel-ben van egy Charles Simonyink, hanem a gépi fordításban is egy Peter Tomank, Toma Péterünk, aki 1968-ban megalapította a SYSTRAN-t, 1968-ban amikor a Google alapítói meg sem születtek.
en.wikipedia.org/wiki/Peter_Toma
engem nem a forditas erdekel, az lenyegtelen, hanem az, hogy tud-e keresni magyarul? jelenleg az ubergagyi polymeta-t kell hasznalnom, ha barmit magyar nyelven akarok keresni..
Egyszerűen nem tudok elképzelni egy olyan angol-magyar fordító programot sem holnap, sem tíz év múlva, amelyik mondjuk helyesen és érthetően lefordít nekem egy Polly Scattergood dalszöveget - hacsak nem úgy, hogy azt előtte valaki már lefordította, feltette a netre, és a program azután csak megkeresi nekem. Hiszen a versek, dalszövegek lényeges tulajdonsága (kellene legyen), hogy a szerző a saját érzéseit, gondolatait eredeti, mások által még nem használt formában, szókapcsolatokkal, fordulatokkal, képekkel fejezi ki, és csak az asszociációra képes ember tudja megérteni, a gép soha. De az eredetiség egy sima blogbejegyzésben is előfordulhat, nem is kell ehhez dalszöveg, vers, vagy novella. Az angol-magyar fordító meg ott áll megfürödve, és azt sem képes eldönteni a szövegkörnyezetből sem, hogy adott esetben a szó melyik jelentését alkalmazza.
Egy webileg imbecillis megjegyzése, aki 'ámtechhülye is:
Erre mondtam én, hogy nemsokára olcsóbb lesz behozni importban a megmondóblogot is, és akkor Tóta W is elmehet az öregapja kaszájával a múzijomba a dínó csontváza mellé mint a nemkorszerűengondolkodó elmaradott magyarparaszt a mesefilmjében ;)
@Patreides: Ha Te ezt várod egy webes fordítótól, akkor eléggé el vagy tájolva. Nem az a lényeg, hogy nyelvészetileg kifogástalanul, költői magasságokban műfordítson. Hanem: 1, a magyarul született cikk _információ tartalma_ megérthető legyen egy nem magyarnak is. 2, a nem magyarul és nem angolul íródott cikkekből is ki tudd hámozni a lényeget. Ha valamilyen kérdésre keresel választ, akkor megnyílhatnak előtted a spanyol, francia, japán stb oldlak is.Ha meg Polly Scattergood szöveget akarsz olvasni akkor azt olvasd eredetiben...
Persze, nem műfordítást várok a gépi fordítóktól. De van egy olyan érzésem, hogy a magyar és egyéb nyelvek között akkor fognak ezek a programok bármilyen szöveget legalább olyan szinten fordítani, mint most mondjuk most a német és angol között, amikor már a versek, dalszövegek sem okoznak gondot ezeknek a fordítóprogramoknak. És azután nem sokkal az egyik ilyen fordítóprogram anélkül, hogy feladatot kapott volna, kiírja majd a kérdést: "Ki vagyok én?" :)
@Patreides: Ne erőltesd. Teljesen másképp kell ezekhez hozzáállni.

Amúgy pedig a webforditas.hu alulról verdesi a szokásos nyugat-európai online fordítók minőségét, és a körülményekhez képest (teljesen más nyelvcsalád stb.) kifejezetten jó.

És én is kíváncsi vagyok, hogy ez licencelt megoldás-e, vagy saját fejlesztés. Csak statisztikai alapon nem lehet fordítót írni, ezt ma már tudjuk.

Most teszteltem a dativust, nem olyan rossz az sem, a morphologic egyértelműsítője jobbnak tűnik.
Valaki itt írta, nem logaritmus. Hanem algoritmus. :)
@Davidon:

Sajna a Link nem teljesen jött be, másoljátok az egész sort...
Egy kis érdekesség a Goggle fordítóprogiból:

translate.google.com/translate_t#en|ro|son

Angolból románra a progi a fia valakinek (son) szót fiúnak írja :-)))

Visszatérve erre:

tomkeller.blog.hu/2009/01/30/en_fureszeltem_az_arceledet

Aki jobban odafigyel (a kommentekben felhívják a figyelmet rá), az észreveszi, hogy az angol szöveg tele van elgépelésekkel. De a legfontosabb a TO DAY -> TODAY az első sorban. Kijavítod, és máris jól fordítja a www.webforditas.hu
Azért látszik, hogy nem kis logikát építettek bele...
@alphanumericus:
a webforditas.hu egy nagyon nagy rakas szar, alapveto, par szavas mondatokat sem tud normalisan leforditani, tapasztalataim szerint 60%os hibahatarral dolgozik nagyjabol. Az meg nem a jo minoseg jele, legalabbis nalam...
Sztem javítsuk azt a törleszi-t törleszti-re :)
A fűrészelő Mery google féle fordításban:
HELLÓ,
A nevem Mery, láttam a profilodat napra lett intrested benned, én is szeretnék tudni, többet, és azt akarom, hogy küldjön egy e-mailt az én e-mail címét, hogy én adom a kép, ha tudják, kivel i am.Here az én e-mail címe (merybugiba@yahoo.com) Azt hiszem, nem hagyhatja el itt vár. (Ne feledje, a távolság vagy a szín nem számít, de a szeretet ügyekben sokat élet) köszönhetően Mery

hááát...
tudjátok, mi lenne nagy dobás?
A Chrome-ba beépíteni a Translate-et. Teljesen automatikus, egy gombos megoldásként.

Vagy akár úgy, hogy beállítod az anyanyelved meg hogy még milyen nyelven beszélsz jól, és a többit on the fly fordítja, eleve úgy jelenik meg a böngésződben.

Szerintem ez egy olyan internetfelhasználónak, mint pl. a nagyim, hatalmas áttörés lehetne :)
Ver Sacrum 2009.02.01. 08:49:05
Sztem javítsuk azt a törleszi-t törleszti-re :)

Inkább: "törlesztette" :)
Megjegyzem, már van magyar nyelv.
igen tényleg megjelent. Lehet örülni, fikázni ki mit szeretne.

Már csak azt volna jó tudni, hogy a google reader-ben mikor lesz valasztható a magyar nyelv, hogy a "Translate into my language" funkciót is használni lehessen.
És ha valaki el tudná nekem magyarázni, hogy került a "lefordított" szövegbe Victor Emmánuel...?
@FZoleeka:

hopp tényleg nem azzal készült de azért ez is lefordította az " I saw your profile"-t
"fűrészelem a profilodat"-ra :DD
De a legjobban a "Crawling Up A Hill" című dal lefordított magyar címe tetszik, mintha Palik László régi közvetítését hallanám a Hungaroringről: "Mászik ki Hill". :) :)
igen, már megy a translate, viszont a webforditashoz képest nagyon gyengus. :(
remélem minőségileg jelentősen javulni fog a következő hónapokban.