Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 13

Članovi tima:

Mentor: Adela Ljajić, naučni saradnik, Istraživačko-razvojni


institut za veštačku inteligenciju Srbije
Komentor: Tijana Radović, analitičar podataka, JAGGAER

Tema: Analiza sentimenta


filmskih recenzija
• Analiza sentimenta se koristi za
određivanje emocionalnog tona ili
sentimenta teksta.
Šta je analiza • Može da se koristi za: praćenje
društvenih medija, analizu povratnih
sentimenta? informacija klijenata i istraživanje
tržišta.
• Glavni izazov u AS-u je složenost
ljudskog jezika.

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 2024. 2
Grupe metoda za analizu sentimenta?

• Lexicon-Based - koristi skup unapred definisanih pravila za određivanje


sentimenta dela teksta, kao što su prisustvo pozitivnih i negativnih reči.
• Machine Learning - koristi obuku modela za identifikovanje sentimenta dela
teksta na osnovu skupa označenih podataka o obuci.
• Deep Learning-Based - koristi korišćenje unapred obučenih modela obučenih
za ogromne količine tekstualnih podataka.

24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 3


Osnovni koraci u analizi sentimenta

Izdvajanje Izgradnja
Ulaz Pretprocesiranje modela Procena
atributa
Sakupljanje Tokenizacija modela
Vreće reči Mašinsko učenje
podataka Normalizacija
N-grami Duboko učenje Evaluacija
Uklanjanje zaustavnih reci performansi modela
TF-IDF Jezički modeli
POS tagovanje poređenjem sa već
Ugrađivanje reči ... postojećim modleima
Lematizacija
...
Stemovanje
...

24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 4


Izabrani dataset
• O datasetu

24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 5


Analiza dataseta
• Broj recenzija po klasama (prikazati grafički)
• Najčešće pojavljivane reči u pozitivnim i negativnim recenzijama
• Distribucija dužine tvitova
• Može i neki wordcloud

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 6
2024.
Izabrana ML metoda npr. Logistic regression
• O metodi

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 7
2024.
Normalzacija – opisati primenjene korake
• Tokenizacija
• Uklanjanje stop reči
• Uklanjanje neželjenih karaktera
• ....

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 8
2024.
Izdvajanje atributa – vekrorizacije teksta
• Tfidf (opisati i prikzati kako je uradjeno)

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 9
2024.
Podela na skup za trening, validaciju i test
• Opisati svrhu podele

24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 10


Trening modela

Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6.


24.06.2024 11
2024.
Rezultati

24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 12


24.06.2024 Letnji naučni kamp „Nauka o podacima“, Beograd 24-26. 6. 2024. 13

You might also like