Πώς συλλέγουμε πληροφορίες από τις Αραβικές χώρες με OSINT εργαλεία

Audax Cybersecurity

Οι πληροφορίες από ομάδες που εμπλέκονται σε διεθνείς συγκρούσεις δεν ήταν ποτέ τόσο προσιτές όσο είναι τώρα. Οι ομάδες επαναστατών, κυβερνοτρομοκρατών δημιουργούν λογαριασμούς στα κοινωνικά δίκτυα,  δημοσιεύοντας βίντεο με εκτοξεύσεις πυραύλων όπως έχουμε δεί να δημοσιεύονται στο Twitter με αποτέλεσμα η αξία της προπαγάνδας να έχει εκτοξευθεί.

Για τους ερευνητές και τους δημοσιογράφους που δεν κατέχουν την αραβική γλώσσα, εξακολουθούν να υπάρχουν τα ίδια προβλήματα: πώς κανείς, χωρίς να γνωρίζει τη γλώσσα μιας περιοχής, συλλέγει ακριβείς και έγκαιρες πληροφορίες;

Ενώ οι παραδοσιακοί πόροι όπως οι μεταφραστές και οι πηγές παραμένουν σημαντικοί, υπάρχουν πολλά εργαλεία και στρατηγικές στο διαδίκτυο για να κάνετε κάποιες, αν όχι το μεγαλύτερο, μέρος της δουλειάς σας.

Η Audax Cybersecurity, δημοσιεύει τον παρακάτω οδηγό και θα σας παρουσιάσει μερικά εύχρηστα εργαλεία που χρησιμοποιούμε και εντός της πλατφόρμας μας την, Cassowary Intelligence Distro, και θα σας βοηθήσει να συλλέξετε πληροφορίες από τις Αραβικές χώρες χωρίς να γνωρίζετε την αραβική διάλεκτο.

Καθιέρωση βασικής κατανόησης

Ο εμφύλιος πόλεμος της Συρίας είναι ένα περίπλοκο χάος συμμαχιών, υποστηρικτών και εχθρών. Ανά εβδομάδα, μια ομάδα μπορεί να γίνει από σύμμαχος εχθρός και το αντίστροφο.

Θα πρέπει να εξοικειωθείτε με τους βασικούς παράγοντες, τις συνολικές παρατάξεις και να αναγνωρίσετε τους σημαντικούς τομείς του ενδιαφέροντος σας. Αυτό περιλαμβάνει την εξέταση σημαντικών κύριων πηγών όπως το Associated Press ή οποιουδήποτε άλλου σημαντικού οργανισμού ειδήσεων για μια ευρεία επισκόπηση ή απλά χρησιμοποιώντας έναν ιστότοπο όπως το Wikipedia.

Αυτό θα σας δώσει κάποια αρχική εικόνα για να ξεκινήσετε την έρευνά σας και τον προσδιορισμό μιας ομάδας, αλλά και σημαντικές πληροφορίες όπως ονόματα πόλεων, ονόματα επαρχιών ή άλλη σημαντική γεωγραφική αναγνώριση.

Μόλις δημιουργήσετε μια βασική κατανόηση, θα είστε έτοιμοι να μεταβείτε σε αυτό που θα είναι διαθέσιμο και θα το μεταφράσετε στα αγγλικά.

Τα αρχικά εργαλεία για την κατανόηση και τον προσδιορισμό μιας ομάδας, αλλά και πληροφορίες όπως ονόματα πόλεων και λοιπά όπως αναφέραμε παραπάνω είναι τα :

Πώς μπορούμε να γράψουμε και να επιβεβαιώσουμε πηγές και πληροφορίες χωρίς να γνωρίζουμε την αραβική γλώσσα;

Το πιο δύσκολο κομμάτι ακόμη και κάποιον που γνωρίζει έστω και μία διάλεκτο της αραβικής γλώσσας, η αραβική γλώσσα έχει παραπάνω από 5 διαλέκτους, είναι να γράψει και να ερευνήσει τα άρθρα από ιστοσελίδες για να μπορέσει στη συνέχεια να τα επιβεβαιώσει για να προχωρήσει η έρευνα του.

Εμείς χρησιμοποιούμε κάποια βασικά εργαλεία για τις έρευνες μας και αυτά είναι:

Από αυτό το σημείο και μετά οι έρευνες σας θα έχουν οδηγηθεί στην διαδικασία αναγνώρισης των πληροφοριών. Ας πούμε ενδεικτικά ότι, γνωρίζετε τις μεγάλες ομάδες σύγκρουσης στην Συρία και έχετε συγκεντρώσει κάποιες σταθερές πηγές μέσων της αγγλικής γλώσσας.

Πριν μεταβείτε σε οποιοδήποτε σχετικό με το αραβικό περιεχόμενο περιεχόμενο, είναι σημαντικό να έχετε μερικά βασικά εργαλεία για να σας βοηθήσουν στην έρευνά σας.

Το Google Translate είναι το προφανές, δίνοντάς σας τη δυνατότητα να μεταφράσετε φράσεις και ονόματα στα αραβικά όταν κάνετε αναζήτηση στο διαδίκτυο.

Η οπτική αναγνώριση χαρακτήρων (OCR) θα βοηθήσει στην αναγνώριση κειμένου και γραφής σε εικόνες που διαφορετικά δεν θα μπορούσατε να διαβάσετε ή δεν περιλαμβάνονται στην ανάρτηση ή δεν μπορείτε να το πετύχετε μέσω Google Translate.

Σίγουρα, και τα δύο αυτά εργαλεία δεν είναι εγγυημένα τέλεια. Για να αντισταθμίσετε τυχόν αποτελέσματα ή αποτελέσματα που δεν ταιριάζουν με το αρχικό κείμενο, θα χρειαστεί να διορθώσετε τα προβλήματα γλώσσας στο πληκτρολόγιο σας.

Για να το κάνετε αυτό, θα πρέπει να εγκαταστήσετε ένα πληκτρολόγιο αραβικής γλώσσας για τον υπολογιστή σας ή να χρησιμοποιήσετε ένα φυσικό πληκτρολόγιο. Δεδομένου ότι αυτό είναι ένας οδηγός για άτομα που δεν μιλούν αραβικά, δείτε την παρακάτω φωτογραφία πώς μπορεί να σας βοηθήσει να προσδιορίσετε και να ταιριάξετε τυχόν επιστολές που μπορεί να δείτε ότι το λογισμικό ή ηΜετάφραση Google ή το OCR δεν ήταν σε θέση να διεκπαιρεώσει.

 

ΠΑΡΑΔΕΙΓΜΑ

 

  1. Η διαδικασία

Έτσι, συναντήσατε μια ανάρτηση στο Liveuamap σχετικά με μια ομάδα που ονομάζεται al-Binyan al-Marsus στο Manshia, Daraa.

Στόχος μας είναι να βρούμε τι γράφει το μήνυμα ή ακόμη και τους άλλους λογαριασμούς κοινωνικών μέσων.

Χωρίς να γνωρίζουμε πολλά για την ομάδα, μπορούμε να κάνουμε μια γρήγορη αναζήτηση στο Google Translate και να πάρουμε μια αρκετά πρόχειρη μετάφραση του “عمليات البنيان المرسي”. 

Αυτό θα μας οδηγήσει σε μία ομάδας του Facebook με ονομάσία “Λιβυκή Επανάσταση”. Αυτό δεν είναι πραγματικά χρήσιμο για την αναζήτησή μας, αλλά θα παρατηρήσετε ότι το όνομά τους είναι γραμμένο ως “عمليات البنيان المرصوص”.

Επειδή δεν μπορούμε να περιμένουμε από τη μετάφραση Google να μεταφράζει σωστά κάθε φράση, ο διπλός έλεγχος σε σχέση με άλλους όρους αναζήτησης είναι ένας πολύ καλός τρόπος για να βρείτε εναλλακτικά ή σωστά ορθογραφικά ονόματα ομάδων.

Μπορούμε να συνδέσουμε το όνομα με το Facebook, το Twitter ή το YouTube και να αναζητήσουμε πιθανές αντιστοιχίες, αναζητώντας οτιδήποτε αντιστοιχεί στο περιεχόμενο από την αρχική ανάρτηση που βρήκαμε.

Για να εξοικονομήσετε χρόνο, μπορούμε να πάρουμε τη μετάφραση του Daraa “درعا” και να τις αναζητήσουμε μαζί. Η αναζήτηση για “درعا عمليات البنيان المرصوص” στο Twitter μας οδηγεί σε αυτή τη σελίδα:

 

Ως επί το πλείστον, οι ομάδες αυτές θέλουν να βρεθούν, θέλουν να έχουν δημόσιο λόγο.

Με την εύρεση αρχικών πηγών θα βρείτε συχνά hashtags και ονόματα οργανισμών για επικείμενες συγκρούσεις ή ανακοινώσεις για πετυχημένες εκστρατείες. Μπορείτε να τα χρησιμοποιήσετε για να περιορίσετε την αναζήτησή σας και να βρείτε ομάδες που συνδέονται μεταξύ τους.

Το πιο σημαντικό σε όλες τις εικόνες που θα βρείτε είναι να εντοπίσετε, εάν και εφόσον υπάρχει, κάτι μέσα στην φωτογραφία που μπορεί να σας οδηγήσει στο γεωγραφικό στίγμα που τραβήχτηκε η εν λόγω φωτογραφία. Ίσως γίνει κάποιο λάθος και εμφανιστεί σε κάποια φωτογραφία ένα σημείο αναγνωρίσιμο, π.χ ένα άγαλμα, ή μία γέφυρα, που μπορεί μέσω άλλων εργαλείων να βρείτε που τραβήχτηκε η φωτογραφία.

Επίσης, το Telegram, μια κρυπτογραφημένη υπηρεσία μηνυμάτων, είναι μία από τις πιο δημοφιλείς και συνεπείς πλατφόρμες για ομάδες. Αν βρείτε τη σελίδα ή το γκρούπ μιας ομάδας, αυτό θα σας οδηγήσει σε μια πολύ πιο σταθερή πηγή πληροφοριών για αυτές τις ομάδες.

Λόγω των προσπαθειών ορισμένων από αυτές τις πλατφόρμες να λογοκρίνουν ή να διαγράφουν σελίδες με γραφικό περιεχόμενο, συνιστάται να προσπαθήσετε να βρείτε τουλάχιστον δύο ή τρεις σελίδες τις οποίες μπορείτε να ακολουθήσετε. Οι ομάδες, ειδικά οι μεγαλύτερες που στοχεύουν σταθερά στα κοινωνικά μέσα, μοιράζονται πάντα τις πιο πρόσφατες σελίδες τους και τις δημοσιεύεσεις τους.

Χρησιμοποιώντας το OCR

Η οπτική αναγνώριση χαρακτήρων (OCR) είναι ένα ισχυρό εργαλείο όταν δεν έχετε πρόσβαση σε τίποτα παρά σε μια εικόνα του κειμένου που προσπαθείτε να μεταφράσετε..

Για να παρακάμψετε και να εξοικονομήσετε χρόνο, μπορείτε να χρησιμοποιήσετε το εργαλείο OCR. Υπάρχουν πολλοί διαθέσιμοι, οπότε δοκιμάστε τις και δείτε ποιος λειτουργεί καλύτερα για εσάς.

Χρησιμοποιώντας το προηγούμενο στοιχείο Tweet, το οποίο έχει αντιστοιχισμένο κείμενο, μπορούμε να συγκρίνουμε τα αποτελέσματα.

Πρώτον, για να διευκολύνουμε το λογισμικό να αναγνωρίζει τα γράμματα, θα κόψουμε όλες τις περιττές εικόνες.

Βρίσκοντας το κατάλληλο εργαλείο OCR θα ανεβάσουμε την εικόνα και θα επιλέξουμε τη γλώσσα που θέλουμε ανιχνεύσουμε.

Ανεβάζουμε την εικόνα πατώντας το UPLOAD και παίρνουμε τα παρακάτω αποτελέσματα:

Χωρίς να γνωρίζουμε όπως είπαμε την αραβική γλώσσα, βρήκαμε την πρώτη και τελευταία φράση. Σίγουρα θα υπάρχουν ορισμένα λάθη, αλλά είμαστε κοντά.

Τώρα μπορούμε να αρχίσουμε να συντονίζουμε τις εισροές μας. Με την αλλαγή του πλαισίου οριοθέτησης γύρω από αυτό, η τοποθεσία OCR μας δίνει αυτό:

Υπάρχουν ακόμη ορισμένα ζητήματα, αλλά τώρα έχουμε τρεις από τις πέντε γραμμές που έχουν καταγραφεί, με ορισμένα διορθωτικά σφάλματα.

Μπορεί να υπάρχουν διάφοροι λόγοι για τους οποίους ο ιστότοπος δεν παίρνει τρίτη ή τέταρτη γραμμή. Σε αυτή την περίπτωση, το φόντο περιλαμβάνει πολλά μικτά γραφικά στοιχεία. Με την επεξεργασία της εικόνας και την αντικατάσταση του χώρου με το μαύρο και την εισαγωγή του στην τοποθεσία λαμβάνουμε:

Έχουμε τώρα τέσσερις γραμμές κάτι πολύ λειτουργικό. Η απομόνωση της φράσης που δεν προσδιορίστηκε καθόλου μας δίνει μια ακόμα πιο δύσκολη μεταγραφή:

 

Συγκρίνοντας τα δύο κείμενα…

أم حسبتم أن تدخلوا الجنة ولما يأتكم مثل الذين خلوا من قبلكم مستهم البأساء والضراء وزلزلوا حتى يقول الرسول والذين آمنوا معه متى نصر الله ألا إن نصر الله قريب

أم خسبتم أن تدخنور الجنة ولم باتكم مثل الذين خنوا من قبيخم هشتهم التأساغ والضزاغ وزلزنوا منتجات السول والذين آقنوا فغة فتى نصز الله أال إن نص الله قريت

.. θα παρουσιάσει ένα σφάλμα, αλλά τελικά ένα λειτουργικό κομμάτι κειμένου και, σε συνδυασμό με το OCR, μπορούμε να κάνουμε τις κατάλληλες διορθώσεις για να μεταφράσουμε ή να αναζητήσουμε την προέλευση του κειμένου. Αυτό το κείμενο παράδειγμα είναι ο στίχος 214 του al-Baqarah, η δεύτερη Σουρά του Κορανίου.

Τις περισσότερες φορές δεν θα εργάζεστε σε περίπλοκα κείμενα όπως αυτό, αλλά δείχνει πόσο αναγκαίο είναι το OCR.

 

Λέξεις-κλειδιά και εικόνες

Το πιο σημαντικό πράγμα που πρέπει να θυμάστε όταν ψάχνετε για ομάδες είναι να ψάχνετε πάντα για μοναδικές λέξεις-κλειδιά ή hashtags.

Αυτά τα κανάλια τα χρησιμοποιούν για να συντονίσουν τις συζητήσεις τους κάτω από ένα συγκεκριμένο θέμα ανά hashtag με πολύ ελάχιστη προσπάθεια και σε λιγότερο χρόνο.Έτσι, η εύρεση κοινών hashtag, λέξεων-κλειδιών ή φράσεων που θα βλέπετε να επαναλαμβάνονται καθ ‘όλη τη διάρκεια των πληροφοριών θα σας οδηγεί συχνά σε άλλες ομάδες.

Η ίδια ιδέα βοηθάει όταν πρόκειται για εικόνες και λογότυπα. Η εύρεση των κοινών εικόνων και μέσων συμβάλλει στην αναγνώριση των συμμαχικών ομάδων, των εφεδρικών καναλιών και των ιδεολογικά συναφών ομάδων.

Καθώς θα περνάτε μέσα από αυτά τα κανάλια, βεβαιωθείτε ότι έχετε πάντα την ερώτηση κατά νου, αν αυτά που διαβάζετε είναι σύμφωνα με τα άλλα κανάλια που έχετε δει. Η παραπληροφόρηση και ψεύτικα κανάλια υπάρχουν πάρα πολλά και μπορούν να σας αποσυντονίσουν πολύ γρήγορα εάν δεν επιβεβαιώνετε οτιδήποτε διαβάζετε.

 

Περιορισμοί και συστάσεις

Αυτό που κερδίσατε από τον οδηγό θα χρησιμεύσει ως ορόσημο για τις έρευνες σας, και δεν αποτελεί μια πλήρης αντικατάσταση των Αραβικών διερμηνέων ή και ακόμη η εκμάθηση της γλώσσας. Μια βασική γνώση των Αραβικών, ακόμα και μια σύντομη εισαγωγική πορεία, μπορεί να σας δώσει μια ακόμη μεγαλύτερη κατανόηση του περιεχομένου και σίγουρα το συστήνουμε ανεπιφύλακτα.

 

«