✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

  • Автор допису:

✨ LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

LLM Сяйво тренуватимуть на унікальних текстах — Укрдержархів передав 10 терабайтів інформації

Ми створюємо національну мовну модель Сяйво, яка розумітиме й знатиме все про Україну, — контекст, історію та діалекти. Для тренування LLM збираємо унікальні дані, які раніше були недоступні для навчання мовних моделей. Один з найбільших наборів інформації надає Державна архівна служба України — близько 10 терабайтів. 

Десять терабайтів — масив текстів у 70 000 книжок. Це перший кейс, коли Укрдержархів ділиться даними для розвитку цифрових сервісів в Україні

🔗 Як стати партнером першого українського ШІ та поділитися текстами для тренування Сяйва, читайте на сайті Мінцифри — https://curly.click/r/c630 

Джерело