✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

10.04.2026, П’ятниця | 16:49
Автор допису: Мінцифра

✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

Ми створюємо національну мовну модель Сяйво, яка розумітиме й знатиме все про Україну, — контекст, історію та діалекти. Для тренування LLM збираємо унікальні дані, які раніше були недоступні для навчання мовних моделей. Один з найбільших наборів інформації надає Державна архівна служба України — близько 10 терабайтів.

Десять терабайтів — масив текстів у 70 000 книжок. Це перший кейс, коли Укрдержархів ділиться даними для розвитку цифрових сервісів в Україні

🔗 Як стати партнером першого українського ШІ та поділитися текстами для тренування Сяйва, читайте на сайті Мінцифри — https://curly.click/r/c630

Джерело

Друк / PDF

✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

Дніпропетровщина 3 серпня 18:30 Четверо людей загинули, 15 – поранені. Понад 60 разів ворог атакував чотири райони області безпілотниками

Виступ Володимира Зеленського на нараді керівників закордонних дипломатичних установ України

Херсонська спортсменка стала призеркою міжнародних змагань з кульової стрільби.

Аналіз доступності КТ: м.Київ Між комп'ютерним томографом і пацієнтом — телефон, запис, черга та відповідальність закладу

⚛️ П'ять штатів допоможуть відродити атомну енергетику США П'ять штатів США – Теннессі, Юта, Луїзіана, Айдахо та Оклахома

У Києві затвердили Регіональний план управління відходами до 2035 року

📌Голова ДСНС України Андрій Даник разом із віцепрем'єр-міністром, міністром закордонних справ Молдови Міхаєм Попшоєм

ДБР попередило замовне вбивство судді в Одесі

Дружківська МТГ

🔻Уламки ворожого дрону впали у Новобаварському районі Харкова. Попередньо, постраждалих немає