Πως το Datablog χρησιμοποίησε τον πληθοπορισμό για να καλύψει το ζήτημα των Ολυμπιακών Εισιτηρίων

Home Chapter: Απόκτηση δεδομένων Next: Χρησιμοποιώντας και κοινοποιώντας δεδομένα: Το γράμμα του νόμου, τα “ψιλά” γράμματα και η Πραγματικότητα

Πως το Datablog χρησιμοποίησε τον πληθοπορισμό για να καλύψει το ζήτημα των Ολυμπιακών Εισιτηρίων

Πιστεύω πως το εγχείρημα του πληθοπορισμού που είχε την μεγαλύτερη ανταπόκριση ήταν ένα μέρος της ψηφοφορίας για τα Ολυμπιακά εισιτήρια. Χιλιάδες ανθρώπων στο Ηνωμένο Βασίλειο προσπάθησαν να πάρουν εισιτήρια για τους Ολυμπιακούς του 2012 και είχε συσσωρευθεί αρκετή οργή από αυτούς που δεν τα κατάφεραν. Το κοινό είχε παραγγείλει εισιτήριαν αξίας χιλιάδων λιρών για να πληροφορηθούν ότι θα μείνουν με άδεια χέρια. Αλλά κανείς δεν ήξερε στην πραγματικότητα αν το όλο θέμα αφορούσε μια μειοψηφία που παραπονιόταν έντονα καθώς η πλειονότητα στην πραγματικότητα ήταν ικανοποιημένη Οπότε επιχειρήσαμε να το ξεδιαλύνουμε.

Αποφασίσαμε πως το καλύτερο που μπορούσαμε να κάνουμε, με την έλλειψη κάθε αξιόλογου στοιχείου επί του θέματος ήταν να απευθυνθούμε στον κόσμο. Και θεωρήσαμε ότι πρέπει να αντιμετωπίσουμε το ζήτημα ήπια καθώς το δείγμα δεν ήταν ισορροπημένο.

Δημιουργήσαμε μια φόρμα από την Google και ρωτήσαμε πολύ συγκεκριμένα πράγματα. Στην πραγματικότητα ήταν μια εκτενής φόρμα. Ρωτούσε τον κόσμο πόσα χρήματα είχαν δαπανήσει για την παραγγελία των εισιτηρίων τους, πόσο είχε χρεωθεί η κάρτα τους, σε ποιους αθλητικούς αγώνες πήγαν και τέτοιου είδους πράγματα.

Figure 13. Πόσα Ολυμπιακά εισιτήρια πήρατε; Τα αποτελέσματα των αναγνωστών (Εφημερίδα The Guardian)

Το αναρτήσαμε ως μια μικρή εικόνα στην κύρια σελίδα του ιστότοπου και κοινοποιήθηκε ταχύτατα. Νομίζω ότι αυτό είναι από τα στοιχειώδη: Δεν μπορείς απλά να σκέφτεσαι «Τι θέλω να ξέρω για την ιστορία μου;» αλλά πρέπει να σκέφτεσαι «Τι θέλει να μου πει ο κόσμος τώρα;» Και όταν επικοινωνείς με ανθρώπους που θέλουν να συμμετέχουν και να βοηθήσουν τότε το εγχείρημα του πληθοπορισμού έχει πετύχει. Ο όγκος των απαντήσεων για αυτό το εγχείρημα, το οποίο ήταν από τις πρώτες μας προσπάθειες με αυτή την μέθοδο, ήταν τεράτιος. Είχαμε εκατοντάδες απαντήσεις σε λιγότερο από μια ώρα και εφτά χιλιάδες μέχρι το τέλος της μέρας.

Έτσι προφανώς, πήραμε πιο σοβαρά τα αποτελέσματα που παρουσιάστηκαν. Αρχικά δεν είχαμε ιδέα πόσο θα ωφελούσε. Γι’αυτό προσθέσαμε μερικούς περιορισμούς: Μπορεί οι αναγνώστες της Guardian να είναι πιο πλούσιοι από άλλους, αυτοί που πήραν λιγότερα εισιτήρια από αυτά που περίμεναν θα ήταν πιθανώς περισσότερο πρόθυμοι να μας μιλήσουν και ούτω καθεξής.

Δεν ξέραμε την αξία των αποτελεσμάτων. Καταλήξαμε να έχουμε στα χέρια μας επτά χιλιάδες αρχεία για να θεμελιώσουμε την έρευνά μας, και ανακαλύψαμε πως οι μισοί περίπου από τους αιτούντες δεν πήραν τίποτα. Ψάξαμε ενδελεχώς το υλικό και δεδομένου ότι πολλοί είχαν λάβει μέρος μόλις την προηγούμενη μέρα, υπήρχε αρκετό ενδιαφέρον για τα αποτελέσματα.

Μερικές εβδομάδες αργότερα, η επίσημη συνοπτική καταγραφή δημοσιεύτηκε και τα στοιχεία μας ήταν εκπληκτικά κοντά σε αυτά. Υπήρχε σχεδόν απόλυτη ταύτιση. Νομίζω αυτό οφείλεται μερικώς στην καλή μας τύχη, αφετέρου στο ότι είχαμε ένα τόσο ευρύ κοινό που ανταποκρίθηκε.

Αν αρχίσεις να ρωτάς τους αναγνώστες για κάτι σαν αυτό, με μια ανάρτηση με δυνατότητα σχολιασμού, θα περιοριστείς με το τι μπορείς να κάνεις με τα αποτελέσματα. Επομένως ως εναρκτήρια σκέψη πρέπει να έχεις «Ποιο είναι το καλύτερο εργαλείο για αυτό που θέλω να μάθω;» Είναι μια ανάρτηση σχολίων; Ή η δημιουργία μιας εφαρμογής; Και αν είναι η δημιουργία μιας εφαρμογής πρέπει να σκεφτείς «Αξίζει η αναμονή; Και αξίζει τους απαιτούμενους πόρους για να γίνει;»

Σε αυτή την περίπτωση, σκεφτήκαμε τις φόρμες της Google. Αν κάποιος συμπληρώσει τη φόρμα, βλέπεις το αποτέλεσμα ως μια γραμμή σε ένα φύλλο εργασίας. Αυτό σήμαινε πως ακόμη και αν υπήρχε μια διαρκής ανανέωση, ακόμη και αν τα αποτελέσματα δεν είχαν βγει ακόμη, θα μπορούσα να ανοίξω το φύλλο εργασίας και να δω αμέσως τα αποτελέσματα.

Θα μπορούσα να προσπαθήσω να κάνω όλη την δουλειά μέσω του Google αλλά την μεταφόρτωσα στο Microsoft Excel και μετά μπόρεσα να τα ταξινομήσω. Επιπλέον, βρήκα τις καταχωρήσεις όπου ο κόσμος είχε γράψει τους αριθμούς ολογράφως αντί των ψηφίων για το ποσό που ξόδεψε, και τα τροποποίησα. Προσπάθησα να αποκλείσω όσο το δυνατόν λιγότερα στοιχεία μπορούσα. Και έτσι αντί να δέχομαι μόνο τις έγκυρες απαντήσεις, προσπάθησα να κάνω μια συνεχή διόρθωση όσων είχα. Κάποιοι είχαν χρησιμοποιήσει ξένα νομίσματα, τα οποία μετέτρεψα σε στερλίνες και εν γένει για όλο αυτό έδειξα αρκετή επιμέλεια.

Παρόλα αυτά η συνολική ανάλυση, πήρε λίγες ώρες και απέρριψα τις εμφανώς ανόητες καταχωρήσεις. Πολλοί έκριναν σκόπιμο να επισημάνουν ότι δεν ξόδεψαν τίποτα για εισιτήρια. Αρκετά φαιδρό μεν, αλλά δεν υπήρξε πρόβλημα. Αφορούσε σχεδόν εκατό από τις επτά χιλιάδες απαντήσεις.

Στη συνέχεια, υπήρξαν κάποιες δεκάδες που ανέφεραν εμφανέστατα ψευδώς τεράστια ποσά προκειμένου να αλλοιώσουν τα αποτελέσματα όπως για παράδειγμα δέκα χιλιάδες λίρες. Αυτό με οδήγησε σε ένα όριο, στο οποίο θα μπορούσα να εφαρμόσω τις απλές, καθημερινές αρχές που χρησιμοποιούμε όλοι. Έκανα τον λεγόμενο συγκεντρωτικό πίνακα, υπολογίζοντας μέσους όρους.

Δεν ξέραμε επίσης πόση ορμή θα είχε το εγχείρημά μας, επομένως δούλευα εγώ κυρίως, μαζί με τον υπεύθυνο για το ιστολόγιο των Αθλητικών. Δουλέψαμε παρέα σκεπτόμενοι ότι είναι κάτι διασκεδαστικό. 24 ώρες το 24ωρο. Είχαμε την ιδέα, αναρτήσαμε κάτι την ώρα του διαλείμματος, το βάλαμε μπροστά-μπροστά στην ιστοσελίδα, είδαμε να γίνεται σιγά-σιγά δημοφιλές, το αφήσαμε εκεί για το υπόλοιπο της ημέρας και παρουσιάσαμε τα αποτελέσματα στο διαδίκτυο το επόμενο πρωί.

Αποφασίσαμε να χρησιμοποιήσουμε το Google Docs καθώς επιτρέπει τον πλήρη έλεγχο των αποτελεσμάτων. Δεν ήμουν υποχρεωμένος να χρησιμοποιήσω τα αναλυτικά εργαλεία κάποιου άλλου προγράμματος. Μπορώ εύκολα να τα μεταφέρω σε ένα λογισμικό βάσεων δεδομένων ή σε κάποιο φύλλο εργασίας. Όταν αρχίσεις να χρησιμοποιείς πιο εξειδικευμένα λογισμικά ψηφοφοριών, τότε περιορίζεσαι και στη χρήση μόνο των εργαλείων τους. Αν οι πληροφορίες που ζητούσαμε ήταν ευαίσθητου περιεχομένου, θα διστάζαμε να χρησιμοποιήσουμε το Google και θα σκεφτόμασταν κάτι πιο κλειστό. Αλλά σε γενικές γραμμές, είναι αρκετά εύκολο να έχουμε μια φόρμα του Google στην σελίδα της Guardian και να είναι αόρατη στον χρήστη. Επομένως είναι πολύ βολική εφαρμογή.

Όσον αφορά τις συμβουλές για δημοσιογράφους δεδομένων που επιθυμούν να χρησιμοποιήσουν στον πληθοπορισμό, πρέπει να γνωρίζουν κάποια πολύ συγκεκριμένα πράγματα. Κάν’τε ερωτήσεις, με απαντήσεις πολλαπλής επιλογής. Προσπαθήστε να αποσπάσετε κάποια βασικά δημογραφικά στοιχεία των συνομιλητών σας ώστε να διακρίνετε τυχόν μεροληψίες του δείγματός σας. Αν ρωτάτε πράγματα σχετικά με αριθμούς ή ποσά, προσπαθήστε να τους διευκρινίσετε ότι επιθυμείτε να τα γράφουν αριθμητικά, σε ενιαία νομισματική μονάδα και ούτω καθεξής. Πολλοί δεν θα το κάνουν, αλλά όσο περισσότερο τους καθοδηγείς, τόσο το καλύτερο. Και πάντα, μα πάντα, προσθέστε ένα πεδίο σχολιασμού γιατί θα υπάρχουν πολλοί που θα συμπληρώσουν τα διάφορα πεδία αλλά θα ενδιαφέρονται περισσότερο να σας δώσουν την άποψή τους για το θέμα. Πόσο μάλλον για μια καταναλωτική εμπειρία (consumer story) ή ένα ξέσπασμα.

— Marianne Bouchart, Data Journalism Blog, συνέντευξη στον James Ball, εφημερίδα the Guardian