Σύμπλεγματα Νοηματοδοτήσεων_ μεθοδολογία ανάλυσης γραπτού λόγου

Μετά την ανάλυση των δεδομένων που συλλέγονται από τα μέσα κοινωνικής δικτύωσης και  του συνόλου των σύγχρονων περιγραφών και των νοηματοδοτήσεων που δίδουν για την περιοχή μελέτης, προκύπτει το ερώτημα πως οι νοηματοδοτήσεις αυτές έχουν εξελιχθεί στο χρόνο.

Για τη διερεύνηση του συνόλου περιγραφών του ερευνητικού πεδίου και την εξέλιξη τους στο χρόνο αναλύονται γραπτά κείμενα διαφορετικών περιόδων.

Στο παρακάτω παράδειγμα αναλύεται απόσπασμα του κειμένου ‘Ελλάδος περιήγησις’που περιγράφει τη περιήγηση του Παυσανία γύρω από την περιοχή μελέτης.

Για την μελέτη του παραδείγματος αυτού επιλέχτηκε το κείμενο του περιηγητή όπως παρουσιάζεται στο αρχείο της Wikipedia,  καθώς  το κείμενο αυτό θεωρείται μια δυναμική βάση δεδομένων που μπορεί να επεξεργαστεί από πλήθος υποκειμένων. Επομένως μπορούν να γίνουν συγκρίσεις με τις περιγραφές που έχουν συλλεχθεί από τα μέσα κοινωνικής δικτύωσης που θεωρούνται επίσης ένα δυναμικό αρχείο που μπορεί να επεξεργαστεί από πλήθος υποκειμένων.

1PAYS

ανάλυση κειμένου Περιηγήσεις Παυσανία με βάση την περιγραφόμενη μεθοδολογία, με την χρωματική διαβάθμιση περιγράφονται τα κυρίαρχα ζεύγη νοημάτων

Mεθοδολογία Ανάλυσης Κειμένου :

  1. Aναγνώριση και αφαίρεση των λέξεων που σταματούν τη ροή του κειμένου (stopwords). Στην κατηγορία αυτή ανήκουν τα άρθρα, σύνδεσμοι και λέξεις που επαναλαμβάνονται συχνά στο κείμενο χωρίς να μεταβάλουν το περιεχόμενο του.
  2. Έυρεση ρίζας των λέξεων που θα αναλυθούν προκειμένου να μετατραπούν στο αρχικό τους μόρφωμα
  3. Μετατροπή όλων των κεφαλαίων γραμμάτων σε μικρά ώστε το κείμενο να έχει ενιαία μορφή.

2PAYS

ανάλυση κειμένου Περιηγήσεις Παυσανία με βάση την περιγραφόμενη μεθοδολογία, με την χρωματική ανάλυση περιγράφονται οι κυρίαρχοι κόμβοι – λέξεις του δικτύου σημασιοδότησης

4. Το κείμενο ενιαίας μορφής εισάγεται στο πρόγραμμα οπτικοποίησης και ανάλυσης δεδομένων Gephi όπου χρησιμοποιείται το επιπρόσθετο πρόγραμμα Semantic Web Import Plug in. Το πρόγραμμα αυτό συλλέγει δεδομένα από τη βάση δεδομένων της Wikipedia Dbpedia και τα επεξεργάζεται σύμφωνα με τον κανόνα συσχετίσεων (αλγόριθμο) που καθορίζεται από το χρήστη.

5. Στην προκειμένη περίπτωση ο αλγόριθμος καταγράφει το πλήθος λέξεων που χρησιμοποιούνται στο εισαγόμενο κείμενο και στη συνέχεια ‘σκανάρει’ τα ζεύγη λέξεων. Κάθε λέξη του κειμένου εμφανίζεται ως κόμβος του δικτύου και κάθε ζεύγος λέξεων εμφανίζεται ως σύνδεση του δικτύου. Για κάθε ζεύγος λέξεων που καταγράφεται μια φορά το βάρος της σύνδεσης είναι 1, για κάθε ζεύγος λέξεων που καταγράφεται δύο φορές το βάρος είναι 2 κ.ο.κ.

Συμπεράσματα

Το μεθοδολογικό αυτό εργαλείο δίνει τη δυνατότητα της ανάλυσης του γραπτού λόγου και του προσδιορισμού του συμπλέγματος των νοηματοδοτήσεων που προκύπτουν από αυτόν. Δημιουργείται ένα σημασιολογικό δίκτυο που υποδεικνύει τις κυρίαρχες περιγραφές κάθε κειμένου. Στον αρχιτεκτονικό σχεδιασμό με την κατάλληλη επιλογή του κειμένου μπορούμε να εξάγουμε συμπεράσματα για τις κυρίαρχες νοηματοδοτήσεις που αντιπροσοπεύουν κάθε χρονική περίοδο μελέτης.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s