Наука и технология

G42 запускает Guess, самый качественный в мире конвертер чатов на арабском языке

Абу-Даби (UNA/WAM) – «Inception», центр искусственного интеллекта группы «G42», объявил о запуске открытой версии модели «GIS» — крупнейшей лингвистической модели для арабского языка высочайшего качества. в мире.

GEIS основана на 13 миллиардах показателей и обучена на недавно разработанном наборе данных, который включает 395 миллиардов символов на арабском и английском языках.

Модель «GES», названная в честь самой высокой вершины Объединенных Арабских Эмиратов, будет использовать преимущества генеративного искусственного интеллекта в арабском мире.

Данная модель является результатом сотрудничества Центра «Начало»; Университет искусственного интеллекта Мохаммеда бен Заида, первый в мире последипломный университет, специализирующийся на исследованиях искусственного интеллекта; и Cerebras Systems Inc.

Модель была обучена с использованием Condor Galaxy, суперкомпьютера на базе искусственного интеллекта с вычислительной мощностью в несколько экзафлопс (один миллион триллионов вычислений в секунду), который был разработан в сотрудничестве G42 и Cerebras Systems.

Запуск «GES» — очень важная веха в области искусственного интеллекта в арабском мире. Эта модель, разработанная в столице Эмиратов Абу-Даби, предоставляет более чем 400 миллионам говорящих на арабском языке важную возможность изучить потенциальные возможности генеративного искусственного интеллекта, а также укрепляет позиции ОАЭ как ведущего центра искусственного интеллекта и инноваций. , сохранение культуры и международное сотрудничество.

Центр «Начало» стремится, открыв исходный код модели «Джайс», стимулировать участие научного и академического сообщества и разработчиков в ускорении роста жизненно важной системы искусственного интеллекта на арабском языке и повышении уровня инновации в этой области.В настоящее время достаточно представлены в популярных средах искусственного интеллекта.

Эндрю Джексон, генеральный директор Центра искусственного интеллекта Inception, сказал: «В Inception мы считаем, что сотрудничество является основой процветания. Сегодня мы устанавливаем новый стандарт развития искусственного интеллекта в регионе Ближнего Востока, обеспечивая при этом выдающееся положение арабского языка со всем его богатством и наследием на арене искусственного интеллекта. «GES» отражает нашу твердую приверженность к совершенству, инновациям и распространению системы искусственного интеллекта в более широком масштабе».

В свою очередь, профессор Эрик Цзэн, президент Университета искусственного интеллекта Мухаммеда бен Заида, заявил: «Разработка большой лингвистической модели арабского языка такого уровня потребовала проведения передовых исследований в области искусственного интеллекта и получения глубокого понимания арабского языка с его разнообразием и богатым наследием, а также растущей значимостью крупных лингвистических моделей в различных областях жизни общества. «Университет искусственного интеллекта Мохамеда бен Заида продолжит разрабатывать большие языковые модели, которые будут эффективными, результативными и точными».

«ГИС» — это большая языковая модель на основе преобразователя, которая использует множество расширенных функций, включая функцию ALiBi, которая позволяет модели экстраполировать длинные последовательности для обеспечения лучшего и более точного контекста. Одной из новаторских технологий, используемых в модели, также является функция, которая активирует закрытые линейные блоки «SwiGLU» и определяет максимальные параметры обновления с целью повышения эффективности и точности обучения модели.

Команды Центра искусственного интеллекта и Начального центра Университета Мохамеда бен Заида работали над оценкой и модификацией модели «ГИС» с открытым исходным кодом, которая была обучена на специальном наборе данных, включающем 116 миллиардов токенов на арабском языке, чтобы учесть сложность, разнообразие и богатство. этого языка с использованием «Кондора» Galaxy 1 (CG-1), недавно анонсированного суперкомпьютера искусственного интеллекта, разработанного в сотрудничестве G42 и Cerebras Systems. Набор данных также включал 279 миллиардов английских токенов, чтобы обеспечить оптимизацию производительности модели посредством двуязычного преобразования. Начальный центр и Университет искусственного интеллекта Мохамеда бен Заеда продолжат совершенствовать и расширять модель ГИС, чтобы идти в ногу с ростом сообщества пользователей.

Эндрю Фельдман, генеральный директор Cerebras Systems, сказал: «Наше стратегическое партнерство с G42 уже дало выдающиеся результаты, поскольку несколько недель назад мы представили суперкомпьютер Condor Galaxy на базе искусственного интеллекта с вычислительной мощностью в несколько эксафлопс. Сегодня это партнерство приносит еще одно исключительное достижение: великолепную лингвистическую модель арабского языка, предназначенную для сообщества разработчиков программного обеспечения с открытым исходным кодом. В Cerebras мы всегда стремились разрабатывать передовые технологии и исследовать инновационные способы их использования. «GES» представляет собой крупный вклад в мировое сообщество программного обеспечения с открытым исходным кодом и является ощутимым свидетельством простоты использования компьютера «Condor Galaxy 1» и его способности разрабатывать модели искусственного интеллекта с головокружительной скоростью».

(окончено)

Связанные новости

Перейти к верхней кнопке