Microsoft демонструє універсальний перекладач з англійської на китайську мову, який зберігає ваш голос та акцент

Універсальний перекладач Star Trek

На заході в Китаї керівник досліджень Microsoft Рік Рашид продемонстрував механізм перекладу мови в мову з англійської на мандарин у режимі реального часу. Переклад не тільки дуже точний, але програмне забезпечення також зберігає акцент та інтонацію користувача. Тут ми говоримо не лише про оцифрований роботизований перекладач - це твердо входить у сферу Лікар, який або Зоряний шлях універсальний переклад.

Найкращий спосіб оцінити цю технологію - переглянути відео нижче. Перші шість хвилин або близько того - Рік Рашид пояснює фундаментальну складність комп’ютерного перекладу, а потім останні кілька хвилин фактично демонструє механізм перекладу мови з мови на мову з англійської на мандарин. На жаль, я не розмовляю китайською, тому не можу засвідчити правдивість перекладу, але аудиторія - близько 2000 китайських студентів - здається, вражена. Професійний англійський / китайський перекладач також зауважив мені, що комп’ютерний переклад напрочуд хороший; не зовсім до рівня людського перекладу, але він наближається.





Звичайно, є багато технологічного майстерства що відбуваються за лаштунками. Для початку програмне забезпечення потрібно навчити - як з кількома годинами рідної, розмовної китайської, так і годиною розмовної англійської мови Ріка Рашида. Від цього програмне забезпечення по суті розбиває вашу мову на найдрібніші компоненти (фонеми), а потім змішує їх разом із китайським еквівалентом, створюючи велику карту звуків з англійської на мандарин. Потім, під час фактичної презентації на сцені, програмне забезпечення перетворює його промову в текст (як ви бачите на лівому екрані), його текст у мандаринський текст (правий екран), а потім Рашид / китайський пюре, створений під час тренінгу процес використовується для перетворення цього тексту на вимовлені слова.

Кінцевий результат, безумовно, має сильний натяк на оцифрований, роботизований Microsoft Sam, але дивно, наскільки збережено акцент, тембр та інтонацію Рашида.



Що стосується точності, Microsoft зазначає, що повна система має рівень помилок приблизно в одному слові з восьми - це поліпшення на 30% порівняно з попереднім найкращим з одного слова з п'яти. Таке різке поліпшення стало можливим завдяки використанню Глибокі нейронні мережі, техніка машинного навчання, розроблена Джеффрі Хінтоном з Університету Торонто. Глибока нейронна мережа - це, по суті, штучна нейронна мережа (програмне забезпечення, що моделює тисячі взаємопов’язаних „нейронів“), але з деякими налаштуваннями, щоб більш точно імітувати поведінку людського мозку.

Рухаючись вперед, велике питання полягає в тому, коли програмне забезпечення перекладу мови в мову Microsoft Research фактично знайде свій шлях на ринок - і так, у випадку, якщо вам було цікаво, програмне забезпечення обмежується не лише англійською та китайською мовами; можуть бути використані всі 26 мов, що підтримуються мовною платформою Microsoft, включаючи мандарин до англійської. Найбільш очевидним варіантом використання буде ваш смартфон Windows Phone 8 (або 9?) Або Skype: ви можете зателефонувати в компанію в Китаї, Німеччині чи Бразилії, говорити нормально англійською мовою, і вони чули б ваш голос своєю місцевою мовою . Ви також можете використовувати свій смартфон як універсальний перекладач під час подорожі. Як ви можете бачити нижче, Microsoft працювала з перекладом телефон-телефон у режимі реального часу ще в 2010 році:

Імовірно, Microsoft працює над такими додатками, але це, мабуть, стримується практичними міркуваннями, такими як обчислювальна потужність, необхідна для перекладу мови в мову, або надання простого у використанні інтерфейсу для процесу навчання / навчання. Сам навчальний процес може вимагати більшої обчислювальної потужності, ніж домашній користувач може здійснити. Однак хмара завжди є!

Copyright © Всі Права Захищені | 2007es.com