Galvenais Inovācijas Google AI tagad ļauj lietotājiem nekavējoties tulkot tekstu 27 valodās ar tālruņa kamerām

Google AI tagad ļauj lietotājiem nekavējoties tulkot tekstu 27 valodās ar tālruņa kamerām

Kādu Filmu Redzēt?
 
(GIF: Google)

(GIF: Google)



Pateicoties mākslīgajam intelektam, ceļošana uz ārzemēm nekad nav bijusi tik vienkārša.

Lietotne Google tulkotājs ļauj lietotājiem uzreiz tulkot tekstu. Lietotnē vienkārši norādiet kameru uz tekstu, kuru vēlaties tulkot, un redzēsit, kā tas tiešraidē pārvēršas jūsu vēlamajā valodā tieši jūsu acu priekšā - nav nepieciešams interneta savienojums vai mobilā tālruņa dati. Šī parocīgā funkcija ir bijusi pieejama jau kādu laiku, taču tā bija saderīga tikai ar septiņām valodām. Tagad , pateicoties mašīnmācībai, Google ir jauninājis lietotni, lai uzreiz tulkotu 27 valodas.

Tāpēc nākamreiz, kad esat Prāgā un nevarat izlasīt izvēlni, mēs esam saņēmuši jūsu atbalstu, uzņēmuma programmatūras inženieris Otavio Guds rakstīja par uzņēmuma pētījumu Emuārs .

Google arī tikko izmantoja AI, lai uz pusi samazinātu viņu runas atpazīšanas kļūdas.

No šodienas papildus tulkošanai starp angļu, franču, vācu, itāļu, portugāļu, krievu un spāņu valodām reāllaikā var tulkot arī šādas 20 valodas: bulgāru, katalāņu, horvātu, čehu, dāņu, holandiešu, filipīniešu, Somu, ungāru, indonēziešu, lietuviešu, norvēģu, poļu, rumāņu, slovāku, zviedru, turku un ukraiņu. Un, ja jūs izvēlaties uzņemt attēlu, nevis skatāties teksta tiešraidi, kopumā tiek atbalstītas 37 valodas.

Tātad, kā Google spēja palielināt pieejamo valodu skaitu? Viņi vispirms iegādājās Word Lens, kas iepriekš bija paplašinātās realitātes tulkošanas lietojumprogramma, un izmantoja mašīnmācīšanos un konvolucionālos neironu tīklus, lai uzlabotu lietotnes iespējas. Attēlu atpazīšanas sasniegumi bija galvenie.

Pirms pieciem gadiem, ja jūs datoram iedevāt kaķa vai suņa attēlu, tam bija grūtības pateikt, kurš ir kurš. Pateicoties konvolucionālajiem neironu tīkliem, datori var ne tikai atšķirt kaķus un suņus, bet pat atpazīt dažādas suņu šķirnes, sacīja Good kungs. Jā, tie ir noderīgi ne tikai trippy art —Ja tulkoat ārzemju ēdienkarti vai parakstāties, izmantojot jaunāko Google tulkošanas lietotnes versiju, tagad izmantojat dziļu neironu tīklu.

Soli pa solim

Pirmkārt , Tulkot ir jāatsakā fona nekārtība un jāatrod teksts. Atrodot vienas krāsas pikseļu lāseņus, tiek noteikts, ka tie ir burti. Un, kad šie plankumi atrodas tuvu viens otram, tā saprot, ka tā ir nepārtraukta rinda, kas jālasa.

Nākamais, lietotnei jāatpazīst katra atsevišķā vēstule. Šeit rodas dziļa mācīšanās.

Mēs izmantojam konvolucionālo neironu tīklu, apmācot to burtiem un bez burtiem, lai tas varētu uzzināt, kā izskatās dažādi burti, lasāms emuāra ziņā.

Pētniekiem bija jāapmāca programmatūra, izmantojot ne tikai tīra izskata burtus, bet arī netīrus. Vēstules reālajā pasaulē grauj pārdomas, netīrumi, plankumi un visādi dīvainības, rakstīja Mr Good. Tāpēc mēs izveidojām savu burtu ģeneratoru, lai radītu visu veidu viltus netīrumus, lai pārliecinoši atdarinātu reālās pasaules troksni - viltus atspulgi, viltus plankumi, viltus dīvainības visapkārt. Daži no

Daži no netīriem burtiem, kas izmantoti apmācībai. (Foto: Google)








The trešais solis meklē vārdnīcā atpazītos burtus, lai iegūtu tulkojumus. Lai pievienotu precizitātes mēģinājumu, vārdnīcu meklēšana ir aptuvena, ja S tiek nepareizi nolasīts kā 5.

Visbeidzot, tulkotais teksts tiek renderēts virs oriģināla tādā pašā stilā.

Mēs varam to izdarīt, jo mēs jau esam atraduši un izlasījuši burtus attēlā, tāpēc mēs precīzi zinām, kur tie atrodas. Mēs varam apskatīt krāsas, kas ieskauj burtus, un to izmantot, lai izdzēstu oriģinālos burtus. Un tad mēs varam uzzīmēt tulkojumu uz augšu, izmantojot sākotnējo priekšplāna krāsu, teikts emuāra ziņā.

Lai būtu pēc iespējas efektīvāka un ļautu visas šīs darbības izpildīt reāllaikā bez interneta vai datu savienojuma, Google komanda izstrādāja ļoti mazu neironu tīklu ar augšējo robežu informācijas blīvumam, ko tā var apstrādāt. Tā kā viņi ģenerēja paši savus apmācības datus, bija svarīgi iekļaut pareizos datus, bet neko papildus, tāpēc neironu tīkls pārāk daudz informācijas blīvuma neizmanto nesvarīgām lietām. Piemērs varētu būt tas, kā tai jāatpazīst burts ar nelielu rotācijas pakāpi, bet ne pārāk daudz.

Galu galā lietotājiem paliek vēl 20 valodas, bet tas pats ātrums.

SKAT ARĪ: Google AI komanda deva mums zemāko līmeni mašīnmācīšanās izpētē

Raksti, Kas Jums Varētu Patikt :