UARU

UARU

Бета-версію української LLM представлять навесні 2026 року

Центр компетенцій WINWIN AI при Міністерстві цифрової трансформації України разом із телекомоператором «Київстар» планує запустити бета-версію національної великої мовної моделі (Large Language Model, LLM) навесні поточного року. Про це йдеться в пресрелізі «Київстар».

Проєкт стартував 2025 року, коли «Київстар» став стратегічним партнером держави й операційним виконавцем розробки. За цей час команди пройшли шлях від формування концепції до реалізації конкретних технічних рішень і наразі завершують підготовчу фазу створення моделі. На поточному етапі фахівці зосередилися на масштабній підготовці даних та формуванні критеріїв якості майбутньої моделі.

- Реклама -

Технологічною основою для української LLM обрано відкриту AI-модель Gemma від Google. Цю модель нового покоління адаптують до особливостей української мови, культурного й історичного контексту України. Відтак модель працюватиме з українською мовою значно краще порівняно з універсальними рішеннями.

Зараз триває критично важливий етап підготовки й верифікації навчальних даних. Якісна українська LLM потребує опрацювання не лише відкритих інтернет-ресурсів, а й історичних архівів та документальних матеріалів. Дані збирають у партнерстві з державними установами, медіаорганізаціями, університетами та науковими інституціями. Водночас значна частина цінних матеріалів досі існує виключно в паперовому форматі, що підкреслює актуальність цифровізації культурної й наукової спадщини країни. Навчання моделі відбуватиметься на спеціально відібраних корпусах текстів, з яких попередньо вилучать персональні дані.

Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому

Для контролю за якістю розробки створено експертний комітет, який працює за чотирма напрямами: науково-технічним, правовим, культурно-історичним та мовним. Ключове завдання комітету полягає в розробці професійних бенчмарків. Ці тести дадуть змогу об’єктивно оцінити якість, коректність і безпеку роботи моделі.

У січні 2026 року команда планує отримати три ключові результати. По-перше, першу верифіковану базу текстових даних для тренування української LLM. По-друге, покращений токенізатор, адаптований до особливостей української мови, що підвищить швидкість і продуктивність обробки текстів. По-третє, власну систему бенчмарків для оцінки якості, ефективності й безпеки мовної моделі.

Одночасно формується юридична рамка проєкту. Вона має забезпечити прозору та безпечну роботу з даними, а також дотримання вимог законодавства у сфері інтелектуальної власності.

Першу версію української LLM планують запустити в форматі бета-тестування навесні 2026 року. Окремо в січні 2026 року у застосунку «Дія» відбудеться публічне голосування за назву української мовної моделі.

- Реклама -

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

- Реклама -

Читайте також

MEGOGO отримав ексклюзивні права на трансляцію чемпіонату Європи з футзалу

MEGOGO отримав ексклюзивні права на показ футзального Євро-2026. Перший матч України проти Вірменії відбудеться 22 січня о 17:00.

Нігерія ліцензувала трьох операторів супутникового інтернету, включно з Amazon Leo

Нігерія дозволила Amazon Leo та двом іншим операторам розгорнути мережу супутникового інтернету у країні. Ліцензії видано строком на сім років.

У лютому Ariane 6 вперше запустить відразу 32 супутники Amazon Leo

У лютому Ariane 64 вперше виведе на орбіту 32 супутники Amazon Leo. Місія відкриє серію з 18 запусків за контрактом 2022 року.

Sony передає виробництво телевізорів Bravia китайській TCL

Sony виділяє телевізійний бізнес у спільне підприємство з китайською TCL. Японська корпорація отримає 49% акцій, TCL — 51%. Запуск у 2027 році.

Як українці споживають теле- та відеоконтент — дослідження lifecell

lifecell оприлюднив дані опитування про перегляд телебачення та відеоконтенту в Україні. Опитування 989 респондентів показало перехід від традицйного ТБ до онлайн-перегляду.

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: