dr Bogna Zacny
Katedra Inżynierii Wiedzy
Wydział Informatyki i Komunikacji
Język programowania wysokiego poziomu, ogólnego przeznaczania
Charakteryzuje się przejrzystością i zwięzłością
Skrypty nie są kompilowane tylko interpretowane przez dedykowany interpreter
Atomowe
Kolekcje
Atomowe
Atomowe
tekstowe
a = 'p'
b = '1'
c = '.'Atomowe
tekstowe
a = 'p'
b = '1'
c = '.'liczbowe
a = 123
b = 12.3
c = 0.8721
Kolekcje
Kolekcje
lista =>[ ]
a = ['mój', 'samochód', 'mój', 'wybór']
b = ['Meritum', 'ZSTiO', 2019]
c = [1, 1, 2, 3, 4.5, 1201, 1]Kolekcje
lista =>[ ]
a = ['mój', 'samochód', 'mój', 'wybór']
b = ['Meritum', 'ZSTiO', 2019]
c = [1, 1, 2, 3, 4.5, 1201, 1]d = 'Meritum'Kolekcje
lista =>[ ]
a = ['mój', 'samochód', 'mój', 'wybór']
b = ['Meritum', 'ZSTiO', 2019]
c = [1, 1, 2, 3, 4.5, 1201, 1]zbiór =>{ }
a = {'samochód', 'mój', 'wybór'}
b = {'Meritum', 'ZSTiO', 2019}
c = {1, 2, 3, 4.5, 1201}
Kolekcje
lista =>[ ]
a = ['mój', 'samochód', 'mój', 'wybór']
b = ['Meritum', 'ZSTiO', 2019]
c = [1, 1, 2, 3, 4.5, 1201, 1]zbiór =>{ }
a = {'samochód', 'mój', 'wybór'}
b = {'Meritum', 'ZSTiO', 2019}
c = {1, 2, 3, 4.5, 1201}
słowik =>{:}
a = {'imię': 'Jan', 'nazwisko': 'Nowak', 'wiek': 23}
b = {'dok1': ['mój', 'samochód', 'mój', 'wybór'],
'dok2': ['mocna', 'herbata', 'na', 'nastrój']}
dok1 = {'mój': 2, 'samochód': 1, 'wybór': 1}
Pętla iteracyjna
Pętla repetycyjna
for
while
for
for i in range(5):
print(i)
Pętla iteracyjna
for
for i in range(5):
print(i)
Pętla iteracyjna
0
1
2
3
4for
for i in [11, 22, 33]:
print(i)
Pętla iteracyjna
11
22
33for
for i in 'ABC':
print(i)
Pętla iteracyjna
A
B
Cfor
Pętla iteracyjna
lista = [0,0,0,0,0,0,0,0,0,0]
for i in range(10):
lista[i] = i
print(lista)
for
Pętla iteracyjna
lista = [0,0,0,0,0,0,0,0,0,0]
for i in range(10):
lista[i] = i
print(lista)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]Pętla iteracyjna - tworzenie kolekcji
Pętla iteracyjna - tworzenie kolekcji
lista = [0,0,0,0,0,0,0,0,0,0]
for i in range(10):
lista[i] = i
print(lista)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]lista = [i for i in range(10)]
print(lista)
Pętla iteracyjna - tworzenie kolekcji
lista = [0,0,0,0,0,0,0,0,0,0]
for i in range(10):
lista[i] = i
print(lista)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]lista = [i for i in range(10)]
print(lista)
Pętla iteracyjna - tworzenie kolekcji
{0: 100, 1: 101, 2: 102, 3: 103, 4: 104,
5: 105, 6: 106, 7: 107, 8: 108, 9: 109}słownik = {i: i + 100 for i in range(10)}
print(słownik)
if
if x > 0:
print('Liczba jest dodatnia')if
if x > 0:
print('Liczba jest dodatnia')if else
if x > 0:
print('Liczba jest dodatnia')
else:
print('Liczba jest ujemna')if
if x > 0:
print('Liczba jest dodatnia')if else
if x > 0:
print('Liczba jest dodatnia')
else:
print('Liczba jest ujemna')if elif else
if x > 0:
print('Liczba jest dodatnia')
elif x == 0:
print('Zero')
else:
print('Liczba jest ujemna')półautomatyczny proces mający na celu wydobycie z zasobów tekstowych informacji
bezbarwne zielone idee wściekle śpią
Noam Chomsky
Wydrze wydrzę wydrze wydrze wydrze wydrzę
Wydrze wydrzę wydrze wydrze wydrze wydrzę
Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo
Wydrze wydrzę wydrze wydrze wydrze wydrzę
Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo
The Buffalo bisons that Buffalo bisons intimidate, intimidate Buffalo bisons.
przekształcenie dokumentów źródłowych do postaci odpowiedniej do dalszej analizy
dokA: "Mocna herbata jest zła na zły nastrój!"
dokB: "Mocna kawa jest dobra na zły nastrój!"
Tokenizacja
dokA = ["Mocna", "herbata", "jest", "zła", "na", "zły", "nastrój!"]
docB = ["Mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój!"]
Normalizacja
dokA = ["Mocna", "herbata", "jest", "zła", "na", "zły", "nastrój!"] docB = ["Mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój!"]
Normalizacja
dokA = ["mocna", "herbata", "jest", "zła", "na", "zły", "nastrój!"] docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój!"]
Normalizacja
dokA = ["mocna", "herbata", "jest", "zła", "na", "zły", "nastrój!"] docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój!"]
Normalizacja
dokA = ["mocna", "herbata", "jest", "zła", "na", "zły", "nastrój"] docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój"]
Lematyzacja
dokA = ["mocna", "herbata", "jest", "zła", "na", "zły", "nastrój"] docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój"]
Lematyzacja
dokA = ["mocna", "herbata", "jest", "zły", "na", "zły", "nastrój"] docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój"]
Jak znaleźć tekst dla słowa kluczowego?
dokA = ["mocna", "herbata", "jest", "zły", "na", "zły", "nastrój"]
docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój"]
Które słowa występują najczęściej?
dokA = ["mocna", "herbata", "jest", "zły", "na", "zły", "nastrój"]
docB = ["mocna", "kawa", "jest", "dobra", "na", "zły", "nastrój"]
zbiórAB = {'mocna', 'kawa', 'herbata', 'jest', 'nastrój', 'dobra', 'zły', 'na'}
Które słowa występują najczęściej?
wekA = {'mocna': 1, 'kawa': 0, 'herbata': 1, 'jest': 1, 'nastrój': 1, 'dobra': 0, 'zły': 2, 'na': 1}
wekB = {'mocna': 1, 'kawa': 1, 'herbata': 0, 'jest': 1, 'nastrój': 1, 'dobra': 1, 'zły': 1, 'na': 1}
Które słowa występują najczęściej?
Które słowa występują najczęściej?
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
Które słowa występują najczęściej?
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
Jak znaleźć tekst dla słowa kluczowego?
Miara ważności TF-IDF
TF-IDF (term frequency-inverse document frequency) polega na ustalaniu względnej częstotliwości słów w danym, lokalnym dokumencie i porównaniu z odwróconą częstotliwością słowa w całej kolekcji dokumentów.
Miara ważności TF-IDF
TF-IDF (term frequency-inverse document frequency) polega na ustalaniu względnej częstotliwości słów w danym, lokalnym dokumencie i porównaniu z odwróconą częstotliwością słowa w całej kolekcji dokumentów.
Miara ważności TF-IDF
TF-IDF (term frequency-inverse document frequency) polega na ustalaniu względnej częstotliwości słów w danym, lokalnym dokumencie i porównaniu z odwróconą częstotliwością słowa w całej kolekcji dokumentów.
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 1 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 1 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 1 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 1 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 2 | 7 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 | 1 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 | 1 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 7 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | Suma | |
|---|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 | 1 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 1 |
TF - częstotliwość słów w dokumencie
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
m - liczba dokumentów
n - liczba dokumentów zawierających słowo
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 | 1 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 | 1 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 | 1 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 | 1 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 2 |
| dokB | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
| 2 | 1 | 1 | 2 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 1 | 1 | 2 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 1 | 1 | 2 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 | 1 | 2 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 | 0,69 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 | 0,69 | 2 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 | 0,69 | 0 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| 2 | 0,69 | 0,69 | 0 | 1 | 2 | 2 | 2 | 2 |
IDF - odwrócona częstotliwość słowa w całej kolekcji dokumentów
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły |
|---|---|---|---|---|---|---|---|
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF-IDF
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły |
|---|---|---|---|---|---|---|---|
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | ||||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | ||||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | ||||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | |||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | |||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | ||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | ||||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | |||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | |||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | ||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | ||||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | |||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | |||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | ||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | ||
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | |
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | |
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB |
TF-IDF
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
TF-IDF
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
TF-IDF
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
TF-IDF
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 | 0 |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
TF-IDF
| 0,69 | 0,69 | 0 | 0,69 | 0 | 0 | 0 | 0 |
TF
IDF
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 | 0 | 0 | 0,1 | 0 | 0 | 0 | 0 |
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,14 | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,29 |
| dokB | 0,14 | 0 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 | 0,14 |
TF-IDF
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 | 0 | 0 | 0,1 | 0 | 0 | 0 | 0 |
słowa kluczowe
| dobra | herbata | jest | kawa | mocna | na | nastrój | zły | |
|---|---|---|---|---|---|---|---|---|
| dokA | 0 | 0,1 | 0 | 0 | 0 | 0 | 0 | 0 |
| dokB | 0,1 | 0 | 0 | 0,1 | 0 | 0 | 0 | 0 |
dokA: ['herbata'] dokB: ['dobry', 'kawa']