изменение размерности признакового пространства
Представим выборку в ортогональном базисе
Как отобразить большую кучу признаков в маленькую кучу признаков?
Ковариация признаков:
Матрица ковариации:
Матрица ковариации представляет собой симметричную матрицу, где на диагонали лежат дисперсии соответствующих признаков, а вне диагонали — ковариации соответствующих пар признаков
Главные компоненты - собственные вектора матрицы (Mwi=λiwi)
Подпространство исходных признаков
Основные задачи:
d - документ, D - множество документов, t - слово
s = ['Mars has an athmosphere', "Saturn 's moon Titan has its own athmosphere",
'Mars has two moons', 'Saturn has many moons', 'Io has cryo-vulcanoes']
Предположим, что вероятность появления слова в данном месте зависит от контекста, тогда:
wo - вектор слова;
wc - вектор контекста;
s(wo,wc) - мера расстояния между этими векторами (например, косинусная)
учитываются: