Hari terakhir kelas sadasa academy
Ujang Fahmi, M.P.A
1. Data Science
2. Pre-processing
3. Visualisasi Data
4. EDA
5. Ujian
Duplicate
| Username | Teks | duplicate |
|---|---|---|
| @akuna | aku beli roti | False |
| @akunb | aku beli roti | True |
| @akuna | akun2 bodong | False |
| @akunc | aku beli roti | True |
Normalisasi
| Username | Teks | Normal Teks |
|---|---|---|
| @akuna | aku yg beli roti | aku yang beli roti |
| @akunb | yg pengen beli makan ngacung | yang ingin beli makan ngacung |
| @akuna | jgn pernah lakukan itu padq | jangan pernah lakukan itu padaku |
Kamus normalisasi
Kamus stopwords twitter
Kamus stopwords bahasa
Lexicon-based Sentiment Analysis
Sentiwords
Negating words
Booster words
Question words
Emoticon
Idioms
Using 6 dictionaries
Lexicon-based Sentiment Analysis (example)
Sentiwords
Negating word
Booster word
aku tidak suka sekali melihat mereka bahagia
+4
-5
neg
1
+4
=
Total sentiment value
-1
Negative
Wahid, D., & SN, A. (2016). Peringkasan Sentimen Esktraktif di Twitter Menggunakan Hybrid TF-IDF dan Cosine Similarity. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 10(2), 207-218. doi:https://doi.org/10.22146/ijccs.16625
Reference
Code Reference
Login dengan email dan buat pasword. Lalu pilih Tim, Rentang Waktu, dan kata kunci yang akan dilihat
Distribusi menunjukkan aliran twit dengan sentinmen positive, negative, dan netral. Porsi Sentimen menunjukkan perbandingan jumlah twit antar sentimen.
Active hours menunjukkan twit paling banyak di posting pada jam berpa pada tiap tanggal. Semakin tebal semakin banyak jumlah twitnya.
Most used hashtag menunjukkan 15 tagar yang paling banyak digunakan. Buzwords menunjukkan kata yang paling banyak digunakan dalam twit yang menjadi data.
Semantic network menunjukkan hubungan antar kata yang bisa dipilih melalui menu