The Data Journalism Handbook 1.0
Loading

Πληθοποριστικά δεδομένα στο Datablog της Guardian

Ο πληθοπορισμός (crowdsourcing) [σύμφωνα με την Wikipedia είναι «μια συλλογική διαδικασία επίλυσης προβλημάτων που περιλαμβάνει την ανάθεση καθηκόντων σε ένα δίκτυο ανθρώπων, τους οποίους χαρακτηρίζουμε επίσης και ως πλήθος». Το ακόλουθο απόσπασμα είναι από μια συνέντευξη με τον Simon Rogers στο πως το Datablog χρησιμοποίησε τον πληθοπορισμό (crowdsourcing) για να καλύψει το σκάνδαλο των βουλευτικών δαπανών, τη χρήση των ναρκωτικών και τα έγγραφα της Sarah Palin.

Μερικές φορές θα αποκτήσεις ένα τεράστιο φορτίο αρχείων, στατιστικών ή αναφορών που είναι αδύνατο να διερευνήσει διεξοδικά ένα άτομο. Ακόμη, μπορείτε να αποκτήσετε έλεγχο σε υλικό που είναι μη προσβάσιμο ή σε κακή μορφή αρχείου ώστε να μην είστε σε θέση να κάνετε κάτι περισσότερο. Σ’αυτές τις περιπτώσεις ο πληθοπορισμός μπορεί να βοηθήσει.

Η Guardian έχει πάρα πολλούς αναγνώστες. Αν χρειαζόμαστε καταχωρήσεις, σε ένα ενδιαφέρον εγχείρημα, τότε μπορούμε να τους ζητήσουμε βοήθεια. Αυτό κάναμε με τις δαπάνες των βουλευτών. Είχαμε 450.000 αρχεία και πολύ λίγο χρόνο για να κάνουμε κάτι. Οπότε ποια ήταν καλύτερη λύση από το να ανοίξουμε το θέμα στους αναγνώστες μας;

Figure 12. Ένα αντίγραφο των απρόσμενων δαπανών του Stephen Pound που έχει επιμεληθεί(Εφημερίδα The Guardian)

Το εγχείρημα των βουλευτικών δαπανων επέφερε μια πληθώρα από «πηγαδάκια». Πήραμε περισσότερες ιστορίες από ότι δεδομένα. Το εγχείρημα θεωρείται ως επιτυχημένο σύμφωνα με την κινητικότητα που παρουσιάστηκε γύρω απ’ αυτό. Ο κόσμος το εκτίμησε πραγματικά.

Επί του παρόντος κάνουμε κάτι με το MixMag στο θέμα χρήσης των ναρκωτικών, το οποίο πηγαίνει καλά. Ισως να είναι μεγαλύτερη καταμέτρηση από αυτήν με τα ποσοστά εγκληματικότητας στην Βρετανία από την άποψη του πόσοι άνθρωποι ανταποκρίνονται σε αυτό, πράγμα εκπληκτικό.

Το στοιχείο που έχουν κοινό αυτά τα εγχειρήματα είναι ότι και τα δυο σχετίζονται με ζητήματα που πραγματικά ενδιαφέρουν τον κόσμο, ούτως ώστε και αυτοί να είναι πρόθυμοι να τους αφιερώσουν χρόνο. Τα δεδομένα από τον πληθοπορισμό που έχουμε βασίζονται σε βοήθεια ατόμων προσηλωμένων. Με τις βουλευτικές δαπάνες, στην αρχή είχαμε ένα τεράστιο ποσοστό δραστηριοποίησης και το οποίο μειώθηκε αισθητά. Ωστόσο έχουμε ακόμα άτομα που ασχολούνται ένθερμα με την ενδελεχή μελέτη σελίδας προς σελίδα σε αναζητώντας θέματα παρεκτροπών ή άλλες ιστορίες. Κάποιος είχε μελετήσει 30.000 σελίδες. Γενικά γνωρίζουν αρκετά πράγματα.

Επίσης χρησιμοποιήσαμε τον πληθοπορισμό για τα έγγραφα της Sarah Palin. Πάλι υπήρξε μεγάλη αρωγή στο ξεσκαρτάρισμα(scouring) ακατέργαστων πληροφοριών.

Από την άποψη, παραγωγής ιστοριών, ο πληθοπορισμός δούλεψε καλά για εμάς. Το κοινό το εκτίμησε δεόντως και ευνόησε το προφίλ της Guardian. Αλλά από την άποψη της παραγωγής δεδομένων, δεν τον χρησιμοποιήσαμε τόσο ως μέθοδο.

Κάποια από τα εγχειρήματα του πληθοπορισμού που επιχειρήσαμε και απέδωσαν περίφημα, μοιάζαν περισσότερο με παλαιού τύπου έρευνες. Όταν ρωτάς τον κόσμο για την εμπειρία τους, τις ζωές τους ή τα πεπραγμένα τους, αποδίδουν πολύ καλά γιατί ο κόσμος δεν τα επινοεί. Θα πουν αυτό που αισθάνονται. Όταν τους ρωτήσαμε να κάνουν κατά κάποιον τρόπο την δουλειά για μας, θα πρέπει να βρεθεί ένα πλαίσιο για αυτούς να φτιάξουν τα δεδομένα με έναν τρόπο που να μπορείς να τους εμπιστευθείς.

Όσον αφορά την αξιοπιστία των δεδομένων, νομίζω πως η προσέγγιση του Old Weather είναι ιδιαίτερα καλή. Παίρνουν δέκα ανθρώπους να αναλάβουν κάθε καταχώρηση, που είναι μια καλή μέθοδος για την διασφάλιση της ακρίβειας. Στο θέμα των βουλευτικών δαπανών, επιχειρήσαμε να ελαχιστοποιήσαμε την πιθανότητα να μπουν οι Βουλευτές στο πρόγραμμα και να τροποποιήσουν τα αρχεία τους ώστε να δείχνουν καλύτερα. Αλλά δεν μπορείς να έχεις μόνιμη προστασία σε κάτι τέτοιο. Μπορείς μόνο να προσέχεις για συγκεκριμένες διευθύνσεις ή αν προέρχεται από την περιοχή SW1 του Λονδίνου. Αυτό είναι λίγο πιο περίπλοκο. Τα δεδομένα που εξήγαμε δεν ήταν πάντοτε αξιόπιστα. Μπορεί οι ιστορίες να ήταν θαυμάσιες, αλλά δεν έφερναν καθαρά στοιχεία που θα μπορούσαμε να χρησιμοποιήσουμε με βεβαιότητα.

Αν επρόκειτο αν δώσω συμβουλές σε κάποιον επίδοξο δημοσιογράφο που ασχολείται με ζητήματα δεδομένων, ο οποίος θα θέλει να χρησιμοποιήσει τον πληθοπορισμό για την συλλογή δεδομένων, θα τον ενθάρρυνα να τον εφαρμόσει με ανθρώπους που πραγματικά ενδιαφέρονται γι αυτο και θα συνεχίσουν να ενδιαφέρονται όταν το θέμα πάψει να αποτελεί πρωτοσέλιδη είδηση. Ακόμη και αν του δώσετε μια όψη παιχνιδιού, μπορεί να βοηθήσει περισσότερο με την συμμετοχή ανθρώπων. Όταν ασχοληθήκαμε για δεύτερη φορά με το θέμα των δαπανών, ήταν σαν παιχνίδι με ατομικές αρμοδιότητες για τον καθένα. Και βοήθησε πραγματικά η ανάθεση αρμοδιοτήτων στο κοινό. Αυτό παρουσίασε σημαντική διαφορετικά γιατί πιστεύω πως αν απλώς παρουσιάσεις στο κοινό τον όγκο των πληροφοριών που είναι για μελέτη και πεις «ξεψάχνισέ το» θα είναι μια δύσκολη και άκαρπη δουλειά. Επομένως πιστεύω ότι το να το κάνεις διασκεδαστικό είναι ιδιαίτερα σημαντικό.

Marianne Bouchart, Data Journalism Blog, συνέντευξη του Simon Rogers, στην εφημερίδα “The Guardian”