Что происходит с LLM
Сложные модели = вычислительные ресурсы + данные
loss
params
Что происходит с LLM
Missing token = multitask learning
sentiment
math
classification
coreference
pragmatic
scene graph
Почему они работают
Разметка
open IE vs closed IE
wide domain vs narrow domain
NER
( + coreference)
relation extraction
entity linking
Wide domain vs narrow domain
Computation resourses
All VK posts 2024 (90 mln texts) can be analysed in less than a week
Gnowledge graphs
Gnowledge graphs