Національна LLM: Україна працює над створенням власної великої мовної моделі

До грудня 2025 року Україна матиме власну велику мовну модель

Міністерство цифрової трансформації України разом з національним телекомунікаційним оператором «Київстар» розпочали розроблення власної великої мовної моделі (LLM) для державних установ і приватного бізнесу. Проєкт має забезпечити технологічний суверенітет України в галузі штучного інтелекту та створити безпечні AI-рішення, пристосовані до особливостей української мови й культури. Про це повідомляє пресслужба Мінцифри.

WINWIN AI Center of Excellence при Мінцифрі керуватиме створенням національної LLM, а «Київстар» працюватиме операційним партнером проєкту. Українська мовна модель стане основою для розвитку державних цифрових служб і комерційних AI-продуктів.

- Реклама -

Велика мовна модель — це нейронна мережа, яка може обробляти й генерувати текстовий контент за принципами, схожими на роботу людського мозку. Такі технології використовують для створення чатботів, AI-помічників та інших розумних систем.

Державні AI-продукти на основі національної моделі

Мінцифра планує інтегрувати українську LLM у провідні державні платформи. AI-помічник з’явиться в додатку «Дія» для поліпшення взаємодії громадян з державними послугами. Міністерство також розробляє засоби аналізу законодавчих актів і персоналізовані освітні служби в платформі «Мрія» для формування індивідуальних навчальних програм школярів.

Підписуйтесь на Mediasat у Telegram: тут найцікавіші новини ТБ та телекому

WINWIN AI Center of Excellence наразі працює над понад десятьма AI-продуктами різного призначення. Використання національної мовної моделі дасть змогу значно підвищити якість цих рішень завдяки кращому розумінню української мови й культурного контексту.

Створення національної LLM

Переваги національної мовної моделі

Українська LLM матиме суттєві переваги перед міжнародними аналогами завдяки додатковому навчанню на українськомовних даних. Модель краще розумітиме говори, фахову термінологію й культурні особливості, що забезпечить точніші та слушніші відповіді користувачам.

Особливо важливою перевагою стане можливість обробляти дані виключно на території України. Це вкрай важливо для захисту інформації у галузях оборони, охорони здоров’я, фінансів і державного управління. Національна модель гарантуватиме збереження особистих даних громадян і забезпечуватиме національну кібербезпеку.

«Створення української LLM — важливий крок до лідерства України в галузі ШІ. Ми як держава зможемо створювати зручні AI-служби для громадян і зробимо штучний інтелект помічником уряду», — заявив Віцепрем’єр-міністр з інновацій Михайло Федоров.

Організаційна будова проєкту

Мінцифра створить усі потрібні координаційні структури для забезпечення якісної розробки моделі. Координаційний комітет визначатиме стратегію й бачення розвитку проєкту. До його складу увійдуть представники Мінцифри, WINWIN AI Center of Excellence, профільних державних установ, «Київстару» та спеціалізованих експертних рад.

Етична рада контролюватиме відповідність моделі законодавчим вимогам і етичним стандартам розроблення AI-систем. Технічна рада відповідатиме за архітектуру системи, процеси навчання й технічне втілення проєкту. Безпосередню розробку здійснюватиме проєктна група під керівництвом «Київстару».

Формування наборів даних для навчання

Мінцифра організує збирання навчальних даних через співпрацю з університетами, науковими установами, національними бібліотеками й інтелектуальними фондами. Для попереднього навчання моделі використовуватимуть виключно відкриті українськомовні джерела, зібрані у спеціальних наборах даних.

- Реклама -

Міністерство гарантує, що особисті дані, відомості з державних реєстрів і будь-які інші чутливі відомості не використовуватимуть у процесі навчання моделі. Це забезпечить дотримання засад приватності й захисту даних громадян.

«Київстар» як технологічний партнер держави

Національний оператор електронних комунікацій «Київстар» став стратегічним партнером Мінцифри у втіленні проєкту. Компанія має значний досвід у галузі штучного інтелекту й активно вбудовує AI-технології у свою довгострокову стратегію розвитку.

«Київстар» поєднує мовні моделі із сучасними RAG-системами для поліпшення створення контенту, забезпечуючи високі стандарти безпеки й етичності. Компанія має доступ до міжнародної експертизи через материнську структуру VEON, яка успішно втілила національні AI-проєкти в інших країнах.

«Участь у створенні національної української LLM — це природний крок для «Київстару» як технологічного лідера, адже наші стратегічні цілі повністю збігаються з державним баченням розвитку AI-галузі. Разом з Міністерством цифрової трансформації ми хочемо створити відкриту національну екосистему, де бізнес, держава й наука спільно розвиватимуть українську AI-інфраструктуру для забезпечення технологічного суверенітету України та підтримки національних цифрових служб», — розповів СЕО «Київстару» Олександр Комаров.

Економічні переваги й перспективи

Використання національної мовної моделі коштуватиме значно дешевше для українських користувачів порівняно з англомовними аналогами від міжнародних провайдерів. Після завершення розробки й тестування модель стане власністю української держави з правом безплатного використання.

Поява українськомовної LLM стимулюватиме розвиток AI-стартапів, залучення міжнародних інвестицій і зростання ВВП завдяки створенню новаторських рішень для різних галузей економіки. Проєкт сприятиме формуванню національної екосистеми штучного інтелекту.

Терміни втілення й участь у проєкті

Розробка ґрунтуватиметься на одному з open-source рішень без залучення державних коштів. Першу робочу версію національної моделі планують представити до грудня 2025 року.

До участі в проєкті запрошують мовознавців, науковців і ML-розробників. Зацікавлені фахівці можуть надіслати заявку на електронну адресу ai@thedigital.gov.ua для долучення до створення української великої мовної моделі.

- Реклама -

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

- Реклама -

Читайте також

З’явився сервіс, який перетворює YouTube на аналог кабельного телебачення

Вебсервіс Channel Surfer перетворює YouTube на аналог кабельного телебачення — 40 тематичних каналів без алгоритмів і мук вибору.

Петиція про створення безпечної української соцмережі набрала лише 25 голосів

Петиція до Кабміну про окрему безпечну соцмережу для українців на основі держзастосунків набрала лише 25 голосів із 25 тисяч і не потрапить на розгляд.

Mantis Space створює мережу орбітальних апаратів для лазерної передачі сонячної енергії супутникам у тіні Землі

Mantis Space залучила 10 млн доларів на орбітальну мережу для передачі сонячної енергії супутникам лазером. Перший прототип планують запустити у 2028 році.

Вчені: згоряння супутників стає новим джерелом забруднення атмосфери

Супутники, що згоряють в атмосфері, виділяють оксид алюмінію та сажу. Вчені попереджають про загрозу озоновому шару й закликають переосмислити їхню утилізацію.

Через напруженість у Перській затоці Meta призупинила прокладку одного з сегментів підводного кабелю 2Africa

Через загострення на Близькому Сході підрядник Meta призупинив прокладку сегмента Pearls кабельної системи 2Africa у Перській затоці.