Twitter sentiment analysis for FX
Date Issued
2016
Author(s)
Advisor
Abstract
Η συγκεκριμένη διπλωματική εργασία θα ασχοληθεί αρχικά με την εξόρυξη δεδομένων μέσα από κοινωνικά μέσα δικτύωσης που στο επίκεντρο τους έχουν τον δείκτη FOREX. Ο δείκτης FOREX ή αλλιώς FX είναι μια αγορά, στην οποία πραγματοποιούνται οι συναλλαγές των διαφόρων διεθνών συναλλαγμάτων. Ως αποτέλεσμα του τεράστιου όγκου της και της ρευστότητάς της, η αγορά FX εξελίχθηκε στη μεγαλύτερη και σημαντικότερη χρηματοπιστωτική αγορά του κόσμου. Πιο συγκεκριμένα, όπως αναφέρεται και στον τίτλο της διπλωματικής εργασίας, θα συλλεχτεί αρχικά, με την χρήση ενός API που θα δημιουργηθεί, μεγάλος όγκος δεδομένων από χρήστες του Twitter οι οποίοι σχετίζονται έμμεσα ή άμεσα με τον δείκτη FOREX. Στην συνέχεια θα επεξεργαστούν και θα ελεγχτούν ώστε να μην περιέχουν ελλιπή ή αχρείαστα δεδομένα. Με αυτό τον τρόπο θα μείνουν μόνο τα χρήσιμα δεδομένα τα οποία θα αποτελούν την σωστή πληροφορία που θα χρειαστεί για την εκπόνηση της διπλωματικής εργασίας. Αργότερα αφού συλλεχθούν και επεξεργαστούν τα δεδομένα θα πρέπει να διαμορφωθεί ανάλογα ένας υλοποιημένος αλγόριθμος ο οποίος με την κατάλληλη εκπαίδευση θα αποτελεί ένα σύστημα. Το σύστημα αυτό θα είναι σε θέση να παίρνει ως είσοδο τα επεξεργασμένα δεδομένα και ως έξοδο να κατηγοριοποιεί αυτά τα δεδομένα. Πιο συγκεκριμένα θα ασχοληθούμε με την ανάλυση συναισθημάτων μέσω των δεδομένων από το Twitter όσο αφορά τον οικονομικό δείκτη FOREX. Για την εκπόνηση της παρούσας διπλωματικής εργασίας θα χρησιμοποιηθεί η γλώσσα προγραμματισμού Python και πιο συγκεκριμένα οι δύο αλγόριθμοι ομαδοποίησης, Latent Dirichlet Allocation (LDA) και Non-negative Matrix Factorization (NMF).
File(s)![Thumbnail Image]()
Name
Μανώλη Σ..pdf
Size
941.47 KB
Format
Adobe PDF
Checksum (MD5)
fd9d4d82e62352c6b92cd8382d8957ca

