The Data Journalism Handbook 1.0
Loading

Επιδοτήσεις Λεωφορείων στην Αργεντινή

Από το 2002, οι επιδοτήσεις του δημόσιου συστήματος μεταφορών με λεωφορεία στην Αργεντινή μεγάλωναν εκθετικά, σπάζοντας νέο ρεκόρ κάθε χρόνο. Αλλά το 2011, μετά από τη νίκη στις εκλογές, η νέα κυβέρνηση της Αργεντινής ανακοίνωσε περικοπές στις επιδοτήσεις δημόσιων υπηρεσιών ξεκινώντας από το Δεκέμβρη του ίδιου χρόνου. Την ίδια στιγμή η εθνική κυβέρνηση αποφάσισε να μεταφέρει τη διοίκηση των τοπικών γραμμών λεωφορείων και των γραμμών του μετρό στην κυβέρνηση της πόλης του Buenos Aires. Καθώς η μεταφορά των επιδοτήσεων σ΄ αυτή την τοπική κυβέρνηση δεν είχε ξεκαθαριστεί και υπήρχε έλλειψη ικανών τοπικών κεφαλαίων για να εγγυηθούν την ασφάλεια του συστήματος μεταφορών, η κυβέρνηση της πόλης του Buenos Aires απέρριψε την απόφαση αυτή.

Καθώς αυτά συνέβαιναν, εγώ και οι συνάδελφοί μου στην La Nacion συναντιόμασταν για πρώτη φορά για να συζητήσουμε πώς να ξεκινήσουμε τη λειτουργία της δικής μας δημοσιογραφίας δεδομένων. Ο Εκδότης του Οικονομικού Τμήματος πρότεινε ότι τα δεδομένα επιδοτήσεων που δημοσιεύτηκαν από την Γραμματεία Μεταφορών (Τμήμα Μεταφορών) θα ήταν μια καλή πρόκληση για να ξεκινήσουμε, καθώς ήταν πολύ δύσκολο να βγουν συμπεράσματα εξαιτίας της μορφής και της ορολογίας.

Οι φτωχές συνθήκες του δημόσιου συστήματος μεταφορών επηρεάζουν τη ζωή περισσότερων από 5.800.000 επιβατών ημερησίως. Καθυστερήσεις, απεργίες, βλάβες των οχημάτων, ή ακόμη και ατυχήματα συμβαίνουν συχνά. Έτσι αποφασίσαμε να ψάξουμε που πάνε οι επιδοτήσεις του δημόσιου συστήματος μεταφορών στην Αργεντινή και να κάνουμε τα δεδομένα αυτά εύκολα προσβάσιμα σε όλους τους πολίτες της Αργεντινής μέσω ενός “Ερευνητή Δημόσιων Μεταφορών”, ο οποίος τώρα είναι υπό κατασκευή.

Figure 21. The Transport Subsidies Explorer (La Nación)

Ξεκινήσαμε υπολογίζοντας πόσα λαμβάνουν μηνιαίως από την κυβέρνηση οι εταιρείες λεωφορείων. Για να κάνουμε αυτό ψάξαμε στα δεδομένα που δημοσιεύονται στην ιστοσελίδα του Τμήματος Μεταφορών, όπου δημοσιεύονταν περισσότεροι από 400 PDF φάκελοι που περιείχαν μηνιαίες καταβολές μετρητών σε περισσότερες από 1.300 εταιρείες από το 2006.

Figure 22. Ranking subsidized transport companies (La Nación)

Συμπεριλάβαμε στην ομάδα έναν έμπειρο προγραμματιστή για να αναπτύξει μία “ξύστρα” για να αυτοματοποιήσει την κανονική εκφόρτωση και μετατροπή αυτών των φακέλων PDF σε φακέλους Excel και Βάσεων Δεδομένων. Χρησιμοποιούμε τους φακέλους που προκύπτουν και έχουν πάνω από 285.000 αρχεία για τις έρευνές μας και τις οπτικοποιήσεις μας, και έντυπα και διαδικτυακά. Επι πλέον, διαθέτουμε αυτά τα δεδομένα σε μορφή μηχανικής ανάγνωσης σε κάθε Αργεντινό για να τα επαναχρησιμοποιήσει και να τα μοιραστεί.

Το επόμενο βήμα ήταν να προσδιορίσουμε πόσο κόστιζε στην κυβέρνηση η μηνιαία συντήρηση ενός οχήματος δημόσιας μεταφοράς κατά μέσο όρο. Για να το βρούμε επισκεφθήκαμε μια άλλη κυβερνητική ιστοσελίδα, της Εθνικής Επιτροπής για την Ρύθμιση των Μεταφορών (CNRT), υπεύθυνη για την ρύθμιση των μεταφορών στην Αργεντινή. Σ΄ αυτή την ιστοσελίδα βρήκαμε μια λίστα εταιρειών λεωφορείων που είχαν στην ιδιοκτησία τους 9000 οχήματα συνολικά. Αναπτύξαμε έναν κανονικοποιητή για να μπορέσουμε να ταιριάξουμε ονόματα εταιρειών λεωφορείων και να συσχετίσουμε τις δύο βάσεις δεδομένων.

Για να προχωρήσουμε, χρειαζόμασταν τον αριθμό κυκλοφορίας κάθε ενός οχήματος. Στην ιστοσελίδα του CNRT, βρήκαμε μια λίστα οχημάτων ανά λεωφορειακή γραμμή ανά εταιρεία μαζί με τις πινακίδες τους. Οι αριθμοί κυκλοφορίας των οχημάτων στην Αργεντινή αποτελούνται από γράμματα και αριθμούς που αντιστοιχούν στην παλαιότητά τους. Για παράδειγμα, το αυτοκίνητό μου έχει άδεια κυκλοφορίας IDF234 : το “Ι” αντιστοιχεί στον Μάρτιο-Απρίλιο του 2011. Επεξεργαστήκαμε αντίστροφα τις πινακίδες των λεωφορείων όλων των εταιρειών της λίστας για να βρούμε τη μέση παλαιότητα των λεωφορείων ανά εταιρεία, με σκοπό να δείξουμε πόσα λεφτά πηγαίνουν σε κάθε εταιρεία και να συγκρίνουμε τα ποσά με βάση τη μέση παλαιότητα των οχημάτων τους.

Στο μέσο της διαδικασίας αυτής, το περιεχόμενο των PDF αρχείων που δημοσίευσε η κυβέρνηση και περιείχε τα δεδομένα που χρειαζόμασταν, άλλαξε μυστηριωδώς, ενώ τα URLs και τα ονόματα των φακέλων έμειναν τα ίδια. Μερικοί φάκελοι τώρα δεν είχαν τα κάθετα “συνολικά ποσά” καθιστώντας αδύνατο τον έλεγχο των συνολικών ποσών κατά τη διάρκεια ολόκληρης της περιόδου της έρευνας, 2002-2011.

Πήγαμε αυτή την υπόθεση σε ένα hackathon που οργανώθηκε από τους Hacks/Hackers στη Βοστώνη, όπου ο προγραμματιστής Matt Perry γενναιόδωρα δημιούργησε αυτό που αποκαλούμε ο “PDF Κατάσκοπος”. Η εφαρμογή αυτή κέρδισε την κατηγορία “Πιό Ενδιαφέρουσα” στο γεγονός αυτό. Ο “PDF Κατάσκοπος” δείχνει σε μια ιστοσελίδα που περιέχει φακέλους PDF και ελέγχει αν το περιεχόμενό τους έχει αλλαχθεί. “Ποτέ ξανά μη γελιέστε από την “κυβερνητική διαφάνεια”, γράφει ο Matt Perry.

Figure 23. Comparing age of fleets to the amount of money they receive from government (La Nación)

Ποιός δούλεψε στο Πρόγραμμα;

Μια ομάδα από επτά δημοσιογράφους, προγραμματιστές και έναν διαδραστικό σχεδιαστή δούλεψε πάνω σ΄ αυτή την έρευνα για 13 μήνες.

Οι αναγκαίες δεξιότητες για το πρόγραμμα αυτό ήταν:

  • Δημοσιογράφοι με γνώση του πώς δουλεύουν οι επιδοτήσεις για το δημόσιο σύστημα μεταφορών και ποιοί ήταν οι κίνδυνοι. Γνώση της αγοράς των εταιρειών λεωφορείων.

  • Ένας προγραμματιστής έμπειρος στη διαδικτυακή αναζήτηση, τον εντοπισμό και την κανονικοποίηση δεδομένων, καθώς και στην εξαγωγή δεδομένων από φακέλους PDF σε φύλλα εργασίας Excel.

  • Έναν στατιστικολόγος για την διεκπεραίωση της ανάλυσης δεδομένων και τους διαφορετικούς άλλους υπολογισμούς.

  • Ένας σχεδιαστής για την παραγωγή των οπτικοποιήσεων των διαδραστικών δεδομένων.

Τι εργαλεία χρησιμοποιήσαμε;

Χρησιμοποιήσαμε την Vbasic για εφαρμογές, Excel Macros, Tableau Public και την Junar Open Data Platform, καθώς και την Ruby on Rails, την εφαρμογή χαρτών της Google, καθώς και την Mysql για τον Subsidies Explorer.

Το πρόγραμμα είχε σημαντική επίπτωση. Είχαμε δεκάδες χιλιάδες αναγνώσεις και η έρευνα προβλήθηκε στην πρώτη σελίδα της έντυπης έκδοσης της La Nacion.

Η επιτυχία αυτού του πρώτου προγράμματος δημοσιογραφίας δεδομένων, μας βοήθησε εσωτερικά να οργανώσουμε την εγκατάσταση μιας λειτουργίας επεξεργασίας δεδομένων που θα κάλυπτε την ερευνητική δημοσιογραφία και παρείχε υπηρεσίες στο κοινό. Αυτό είχε ως αποτέλεσμα την Data.lanacion.com.ar, μια πλατφόρμα πάνω στην οποία δημοσιεύουμε δεδομένα σχετικά με διάφορα θέματα δημόσιου ενδιαφέροντος σε μορφή μηχανικά αναγνώσιμη.

Angélica Peralta Ramos, La Nación (Argentina)