Навука і тэхналогіі33

Як гэта працуе: машынны пераклад з розных моваў

7 студзеня 1954 года ў штаб-кватэры карпарацыі IBM у Нью-Ёрку адбыўся так званы «Джорджтаўнскі эксперымент», падчас якога быў паспяхова прадэманстраваны цалкам аўтаматычны пераклад некалькіх дзясяткаў розных сказаў з рускай мовы на ангельскую.

Той пераклад быў вельмі просты: у слоўніку было ўсяго 250 словаў і 6 правілаў, таму сістэма магла перакласці толькі некалькі самых прымітыўных фраз. Але мэтай было прыцягненне ўвагі да машыннага перакладу і дэманстрацыя яго перспектыўнасці.

Цяпер, дзякуючы інтэрнэту, кожнае незнаёмае слова ці сказ можна за некалькі секунд перакласці на родную мову, і гэты пераклад атрымаецца даволі дакладны. Што ж змянілася з тых часоў? Які цяпер прынцып працы аўтаматычных перакладчыкаў і якая будучыня ў жывых перакладчыкаў-прафесіяналаў?

Сучасныя анлайн-перакладчыкі (самы вядомы з якіх — Google Translate) выкарыстоўваюць статыстычны машынны пераклад, у працэсе якога камп’ютарная праграма аналізуе велізарны масіў тэкстаў, перакладзеных людзьмі, і перакладае слоўнік і граматыку адной мовы на іншую ў лічбавым фармаце. Гучыць складана? Давайце разбірацца.

Велізарны масіў тэкстаў складаецца з вялікай колькасці моўных пар — тэкстаў, якія маюць дзве дакладныя моўныя версіі (перакладзеныя чалавекам). У якасці такіх тэкстаў звычайна выкарыстоўваюцца афіцыйныя дакументы шматмоўных краін, дзе пераклад дакументацыі ёсць абавязковым на ўсе дзяржаўныя мовы. Такія пераклады заўсёды найбольш дасканалыя, бо дзяржаўныя дакументы вырашаюць лёс асобных людзей і краіны ў цэлым. Таксама вельмі карыснымі аказаліся шматмоўныя дакументы, якія выпускаюцца ААН. 

Аналізуючы пары розных тэкстаў, сістэма «вучыцца», засвойваючы з кожным разам усё больш новых правілаў. Такім чынам будуецца мадэль мовы.

Таксама кожная сістэма аўтаматычнага перакладу мае мадэль перакладу — «слоўнік», у якім для ўсіх словаў і фраз на адной мове пералічаныя магчымыя пераклады на іншую мову з указаннем верагоднасці гэтых перакладаў. Мадэлі перакладу для кожнай пары моваў утрымліваюць мільёны пар слоў і словазлучэнняў.

Калі вы перакладаеце з англійскай мовы на беларускую, задзейнічаюцца дзве моўныя пары: беларуская-руская і руская-англійская. То бок спачатку тэкст перакладаецца с англійскай на рускую, а потым — з рускай на беларускую.

Такі шлях найбольш рацыянальны, бо дакументаў, якія б мелі дасканалыя англійскую і беларускую версіі — няшмат, і просты пераклад з англійскай на беларускую атрымліваўся б вельмі няякасным праз недастатковую «навучанасць» сістэмы.

Непасрэдна перакладам займаецца дэкодар — алгарытм, які праводзіць аналіз тэксту і для кожнага слова падбірае ўсе варыянты перакладу, упарадкоўваючы іх па змяншэнні верагоднасці. Затым усе атрыманыя варыянты дэкодар ацэньвае з дапамогай мадэлі мовы на частату ўжывання і выбірае прапанову з найлепшым спалучэннем верагоднасці і частаты.

На жаль, цяпер няма сэрвісу аўтаматычнага перакладу, які б мог перакласці тэкст з такой жа дакладнасцю, як і чалавек-перакладчык. Але ўжо цяпер некаторыя кампаніі ўкараняюць у машынны пераклад нейронныя сеткі, якія значна паляпшаюць яго якасць.

Таму можна меркаваць, што з цягам часу спецыялісты-перакладчыкі будуць патрэбныя толькі для стварэння складаных мастацкіх перакладаў, што значна скароціць колькасць людзей, занятых у гэтай сферы. Але наўрад ці гэта вельмі блізкая перспектыва. А як лічыце вы?

Чытайце таксама: Наступная рэвалюцыя ў інфарматыцы — нейронныя сеткі (распавядаем пра нейронныя сеткі простымі словамі)

Каментары3

 
Націсканне кнопкі «Дадаць каментар» азначае згоду з рэкамендацыямі па абмеркаванні.

Цяпер чытаюць

Фатограф-агент з двума пашпартамі здымае беларусаў і іх мерапрыемствы ў Варшаве10

Фатограф-агент з двума пашпартамі здымае беларусаў і іх мерапрыемствы ў Варшаве

Усе навіны →
Усе навіны

Затрыманні ў 2020-м, арышт у 2024-м, эміграцыя ў 2025-м. Гісторыя 21-гадовага беларускага «тэрарыста»2

З птушкафабрыкі пад Гроднам прапала 400 яек качкі. Прычым яйкаманы нават сачылі, як вылупліваюцца качаняты2

Украіна паведаміла пра гібель у Расіі больш за 200 ваеннапалонных2

У справе «Трайпла» з'явіўся новы паварот

Як беларуская кампанія пастаўляе ў Расію брэндавае адзенне ў абыход санкцый і ў шкоду дзяржбюджэту5

«Шчаслівы з маімі новымі сябрамі». На шклозаводзе «Нёман» у Бярозаўцы ўжо некалькі гадоў працуе егіпцянін14

Расіяніна затрымалі ў мінскім аэрапорце за спробу вывезці скрадзеную пяць гадоў таму дачку

Мінчанка паставіла дома камеры, каб назіраць за старэнькай маці, і раскрыла злачынства3

Як беларусам за мяжой скасаваць шлюб, не вяртаючыся на радзіму? Спыталі ў юрысткі2

больш чытаных навін
больш лайканых навін

Фатограф-агент з двума пашпартамі здымае беларусаў і іх мерапрыемствы ў Варшаве10

Фатограф-агент з двума пашпартамі здымае беларусаў і іх мерапрыемствы ў Варшаве

Галоўнае
Усе навіны →

Заўвага:

 

 

 

 

Закрыць Паведаміць