Google TranslateGemma: качественный перевод теперь на смартфоне Обложка: Skyread

Google TranslateGemma: качественный перевод теперь на смартфоне

Новости
Главное:

  • Google представил TranslateGemma — семейство открытых моделей машинного перевода на базе Gemma 3.
  • Модель выпускается в трёх вариантах: 4B параметров для смартфонов, 12B для ноутбуков и 27B для облачных GPU.
  • TranslateGemma поддерживает 55 языков, включая редкие, и умеет переводить текст на изображениях без отдельного OCR.

Google анонсировал релиз TranslateGemma — новых моделей машинного перевода, основанных на архитектуре Gemma 3. Семейство включает три версии с разным числом параметров: лёгкая 4B, оптимизированная для смартфонов, средняя 12B для ноутбуков, а также полноформатная 27B для задач в облачных вычислениях. Особенностью стала высокая точность перевода: 12B-модель показывает качество лучше, чем базовая 27B Gemma 3, при этом допуская на 26% меньше ошибок.

TranslateGemma охватывает 55 языков, среди которых есть и менее распространённые, например исландский и суахили, по которым ошибки снижены на 30% и 25% соответственно. Модель обучалась на большом количестве языковых пар — около 500. Кроме того, TranslateGemma способна переводить текст непосредственно на изображениях — будь то вывески, меню или сканы документов — без необходимости применения отдельного OCR-модуля или дополнительного мультимодального обучения.

Процесс обучения включал два этапа. Сначала применялся supervised fine-tuning на параллельных корпусах с участием как человеческих, так и синтетических переводов, сгенерированных нейросетью Gemini. После этого для улучшения качества использовался reinforcement learning с ансамблем reward-моделей, таких как MetricX-QE и AutoMQM. Для сохранения универсальности и предотвращения «узкой специализации» во время обучения было использовано около 30% общедоступных данных с оригинальной Gemma 3.

Запуск TranslateGemma произошёл практически одновременно с выходом ChatGPT Translate от OpenAI, но в отличие от закрытого решения конкурентов, продукт Google оказался открытым и распространяется под лицензией Gemma Terms of Use. TranslateGemma продолжает серию специализированных моделей Gemma 3, среди которых есть MedGemma и FunctionGemma, что подчёркивает стремление Google развивать открытую экосистему ИИ под различные задачи.

Tagged