изменение размерности признакового пространства
Представим выборку в ортогональном базисе
Как отобразить большую кучу признаков в маленькую кучу признаков?
Ковариация признаков:
Матрица ковариации:
Матрица ковариации представляет собой симметричную матрицу, где на диагонали лежат дисперсии соответствующих признаков, а вне диагонали — ковариации соответствующих пар признаков
Главные компоненты - собственные вектора матрицы (\(M w_i = \lambda_i w_i\))
Подпространство исходных признаков
Основные задачи:
d - документ, D - множество документов, t - слово
s = ['Mars has an athmosphere', "Saturn 's moon Titan has its own athmosphere",
'Mars has two moons', 'Saturn has many moons', 'Io has cryo-vulcanoes']
Предположим, что вероятность появления слова в данном месте зависит от контекста, тогда:
\(w_o\) - вектор слова;
\(w_c\) - вектор контекста;
\(s(w_o, w_c)\) - мера расстояния между этими векторами (например, косинусная)
учитываются: