Деякі з цих мов є одними з найбільших світових мов з більш ніж 100 мільйонами носіїв
Компанія Google виконала найбільше розширення в історії свого сервісу перекладу Google Translate, додавши 110 нових мов включно з кримськотатарською. Для цього використали мовну модель штучного інтелекту PaLM 2. Про це 27 червня повідомили у пресслужбі Google.
Вказується, що у 2022 році компанія Google додала 24 нові мови, використовуючи підхід Zero-Shot Machine Translation, де модель машинного навчання вчиться перекладати на іншу мову, навіть якщо не бачить прикладу. Разом з тим, додавання 110 нових мов є найбільшим розширенням в історії «Google Перекладача», адже ними розмовляють понад 614 мільйонів носіїв.
"Ми постійно впроваджуємо новітні технології, щоб більше людей мали доступ до цього інструменту: у 2022 році ми додали 24 нові мови, використовуючи підхід Zero-Shot Machine Translation, де модель машинного навчання вчиться перекладати на іншу мову, навіть якщо не бачить прикладу. Ми також анонсували ініціативу «1000 мов», яка передбачає створення моделей штучного інтелекту, що підтримуватимуть 1 тисячу найпоширеніших мов світу", - вказується в блозі Google.
Додавання 110 нових мов є найбільшим розширенням в історії «Google Перекладача». Ними розмовляють понад 614 мільйонів носіїв, що відкриває доступ до перекладу для близько 8% населення світу. Деякі з цих мов є одними з найбільших світових мов з більш ніж 100 мільйонами носіїв. Іншими мовами розмовляють невеликі громади корінних народів, а деякі майже не мають носіїв мови, але тривають активні зусилля щодо їхнього відродження. Близько чверті нових мов походять з Африки, що є нашим найбільшим розширенням африканських мов сьогодні, зокрема фон, кіконго, луо, га, сваті, венда та волоф.
Як наголошують в Google, існує багато факторів, які враховують, додаючи нові мови до перекладача. Їхній підхід полягає в тому, щоб надавати пріоритет найбільш вживаним різновидам кожної мови.
"Наприклад, ромська мова має багато діалектів по всій Європі. Наші моделі створюють текст, найбільш близький до південно-влахської ромської, різновиду, який широко використовується в інтернеті. Але він також містить елементи з інших діалектів, таких як північно-влахська та балканська ромська", - йдеться в блозі Google.
Зазначається, що PaLM 2 є ключовим елементом головоломки, який допомагає «Перекладачу» ефективніше вивчати мови, тісно пов’язані одна з одною, зокрема мови, близькі до хінді, як-от авадхі та марваді, і французькі креольські, як-от сейшельська креольська та маврикійська креольська. В компанії обіцяють, що в майбутньому сервіс підтримуватиме ще більше мовних різновидів і правил правопису.
Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.