Στα πλαίσια αυτού του μαθήματος θα επικεντρωθούμε στην έννοια “μεγάλου όγκου δεδομένα” (big data) και θα μελετήσουμε μοντέρνες τεχνικές και πλατφόρμες αποθήκευσης και διαχείρισης τέτοιων δεδομένων. Συγκεκριμένα, θα μελετηθούν: Aρχιτεκτονικές και συστήματα μεγάλης κλίμακας: Δίκτυα ομοτίμων (Peer-to-Peer) και Υπολογιστικά Νέφη (Cloud Computing). Βάσεις δεδομένων στο διαδίκτυο: Σχεσιακές, παράλληλες και κατανεμημένες βάσεις, με έμφαση στις τεχνολογίες κατανεμημένων συστημάτων αρχείων (HDFS), ΝοSQL (HBase, Cassandra), graph-databases(Neo4j), NewSQL. Μοντέλα υπολογισμού μεγάλου όγκου δεδομένων (MapReduce, BSP) και πλατφόρμες που τις εφαρμόζουν (Hadoop, Hama, Spark, κλπ). Εφαρμογές των παραπάνω και υλοποίηση αλγορίθμων με κατανεμημένο τρόπο.