
✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації
Ми створюємо національну мовну модель Сяйво, яка розумітиме й знатиме все про Україну, — контекст, історію та діалекти. Для тренування LLM збираємо унікальні дані, які раніше були недоступні для навчання мовних моделей. Один з найбільших наборів інформації надає Державна архівна служба України — близько 10 терабайтів.
Десять терабайтів — масив текстів у 70 000 книжок. Це перший кейс, коли Укрдержархів ділиться даними для розвитку цифрових сервісів в Україні
🔗 Як стати партнером першого українського ШІ та поділитися текстами для тренування Сяйва, читайте на сайті Мінцифри — https://curly.click/r/c630
Джерело