Από τον Ιωάννη Γουτεμβέργιο στον Liang Wenfeng: Είναι το DeepSeek ο εκδημοκρατισμός της τεχνητής νοημοσύνης;
10:00 - 30 Ιανουαρίου 2025
Για μεγάλο μέρος της ανθρώπινης ιστορίας, η γραπτή γνώση ήταν προνόμιο των λίγων. Ενώ τα πρώτα καταγεγραμμένα κείμενα χρονολογούνται γύρω στο 3100 π.Χ., όταν οι Σουμέριοι κατέγραφαν διοικητικά και οικονομικά δεδομένα σε πήλινες πινακίδες, η πρόσβαση στον γραπτό λόγο παρέμεινε εξαιρετικά περιορισμένη για χιλιάδες χρόνια. Μόνο μια μικρή ελίτ μπορούσε να διαβάζει και να γράφει, πόσο μάλλον να παράγει έγραφα. Αυτή η αποκλειστικότητα παρέμεινε μέχρι την τυπογραφία του Ιωάννη Γουτεμβέργιου τον 15ο αιώνα, μια ανακάλυψη που απελευθέρωσε τον μεγαλύτερο εκδημοκρατισμό της γνώσης στην ανθρώπινη ιστορία. Έκτοτε και με τη πάροδο του χρόνου, ο αλφαβητισμός και η πρόσβαση στην πληροφορία έγιναν σχεδόν καθολικά, τροφοδοτώντας την τεχνολογική και επιστημονική πρόοδο σε πρωτοφανή κλίμακα.
Τώρα, ένας παρόμοιος μετασχηματισμός βρίσκεται σε πλήρη εξέλιξη - αυτή τη φορά στην τεχνητή νοημοσύνη. Στις 26 Δεκεμβρίου 2024, μια σχετικά άγνωστη κινεζική εταιρεία, η DeepSeek, συγκλόνισε τον κόσμο παρουσιάζοντας το DeepSeek-V3, ένα μοντέλο τεχνητής νοημοσύνης που όχι μόνο ανταγωνίζεται τους τιτάνες του κλάδου (το ChatGPT της OpenAI, το Llama της Meta και το Gemini της Alphabet), αλλά και αμφισβητεί τις θεμελιώδεις οικονομικές και τεχνολογικές παραδοχές της ανάπτυξης της τεχνητής νοημοσύνης. Η κυκλοφορία του μοντέλου -που συνοδεύεται από την πλήρη δημοσίευση της ερευνητικής του εργασίας- σηματοδοτεί μια στιγμή καμπής, σπάζωντας φραγμούς σχετικά με την προσβασιμότητα, το κόστος και το μέλλον της τεχνολογικής υπεροχής.
Γιατί το DeepSeek-V3 αποτελεί σημείο καμπής
Ο αγώνας της τεχνητής νοημοσύνης κυριαρχείται εδώ και καιρό από μια χούφτα αμερικανικών εταιρειών, της επονομαζόμενες Marvelous 7. Το ChatGPT της OpenAI, το Gemini της Google και το Llama της Meta έχουν θέσει τα πρότυπα, με κάθε διαδοχική επανάληψη να απαιτεί επενδύσεις δισεκατομμυρίων και υποδομές αιχμής. Το DeepSeek-V3, ωστόσο, αψηφά αυτή τη λογική. Βάσει διεθνών δοκιμών συγκριτικής αξιολόγησης της τεχνητής νοημοσύνης, υποστηρίζει ότι προσεγγίζει ή και ξεπερνά αυτά τα δυτικά μοντέλα σε πολλούς τομείς, παρά το γεγονός ότι εκπαιδεύτηκε κάτω από πολύ διαφορετικές συνθήκες.
Πρώτον, το DeepSeek-V3 είναι ανοικτού κώδικα. Σε αντίθεση με τα κλειστά, ιδιόκτητα αντίστοιχα μοντέλα, αυτό το μοντέλο επιτρέπει σε οποιονδήποτε να έχει πρόσβαση, να μελετήσει, να τροποποιήσει και να βελτιώσει τον κώδικά του. Αυτή η μοναδική απόφαση καταρρίπτει τα υπάρχοντα εμπόδια, επιτρέποντας σε κυβερνήσεις, πανεπιστήμια, νεοφυείς επιχειρήσεις, ακόμη και ιδιώτες να αναπτύξουν τα δικά τους συστήματα τεχνητής νοημοσύνης - χωρίς να βασίζονται στα αμερικανικά μονοπώλια τεχνολογίας.
Δεύτερον, το μοντέλο εκπαιδεύτηκε σε παλαιότερο υλικό -συγκεκριμένα, στα τσιπ H800 της Nvidia- λόγω των αμερικανικών εξαγωγικών περιορισμών που απαγορεύουν στην Κίνα να αποκτά πιο προηγμένη τεχνολογία ημιαγωγών(semiconductors) από το 2022. Αυτοί οι περιορισμοί είχαν ως στόχο να επιβραδύνουν την πρόοδο της κινεζικής τεχνητής νοημοσύνης, αλλά η επιτυχία του DeepSeek δείχνει ότι η καινοτομία μπορεί να ευδοκιμήσει ακόμη και υπό περιορισμούς.
Τρίτον, το κόστος εκπαίδευσης ήταν δραματικά χαμηλότερο από εκείνο των Αμερικανών ομολόγων της. Ενώ εταιρείες όπως η OpenAI και η Google βυθίζουν δισεκατομμύρια στα μοντέλα τους, xαρακτηριστικά, ο Ντόναλντ Τραμπ πριν λίγες μέρες εξήγγειλε έργα υποδομής ΤΝ αξίας 500 δισεκατομμυρίων δολαρίων, η DeepSeek εκπαίδευσε το μοντέλο της σε υποδομές αξίας 5,6 εκατομυρίων δολαρίων, ένα κλάσμα από αυτά που συνήθως δαπανούν οι δυτικές εταιρείες. Επιπλέον, το έκανε αυτό χωρίς να στηρίζεται στο CUDA της Nvidia, πλατφόρμα, η οποία θεωρείται εδώ και καιρό το χρυσό πρότυπο για την ανάπτυξη Τεχνητής Νοημοσύνης μεγάλης κλίμακας. Αυτό σηματοδοτεί μια πιθανή μετατόπιση από την κυριαρχία της Nvidia- μια εξέλιξη που θα μπορούσε να αναδιαμορφώσει τον κλάδο.
Τέλος, το DeepSeek-V3 δεν είναι απλώς φθηνό στην ανάπτυξη, αλλά και αποδοτικό στη λειτουργία του. Η υπολογιστική ισχύς που προσφέρει πωλείται σε κόστος 30 φορές χαμηλότερο από εκείνο των αντίστοιχων αμερικανικών μοντέλων, καθιστώντας την AI υψηλής απόδοσης προσιτή σε ένα πολύ ευρύτερο κοινό προγραμματιστών.
Οι στρατηγικές και οικονομικές επιπτώσεις
Ο αντίκτυπος του DeepSeek-V3 έχει ήδη προκαλέσει δονήσης πέραν της Κίνας. Στην Ουάσινγκτον και τη Silicon Valley, η είδηση έχει αναστατώσει στελέχη και υπεύθυνους χάραξης πολιτικής. Η υπόθεση ότι οι ΗΠΑ είχαν τριετές προβάδισμα στην τεχνητή νοημοσύνη έναντι της Κίνας- ανατράπηκε απότομα. Η Ευρώπη, επίσης, υστερεί, όπως και τα περισσότερα άλλα έθνη που αγωνίστηκαν να συμβαδίσουν με την αμερικανική ηγεμονία της Τεχνητής Νοημοσύνης.
Αλλά είναι στα μικρότερα έθνη και στις μεσαίες επιχειρήσεις όπου οι επιπτώσεις είναι ίσως πιο βαθιές. Σκεφτείτε την Κύπρο, μια χώρα που -μέχρι πρόσφατα- θα χρειαζόταν να επενδύσει το ΑΕΠ δύο ετών για να αναπτύξει ένα εθνικό μοντέλο τεχνητής νοημοσύνης ανταγωνιστικό με εκείνα του OpenAI ή της Google. Σήμερα, το κόστος αυτό έχει πέσει στο κλάσμα του κόστους της ανακαίνισης της πλατείας Ελευθερίας. Παρομοίως, μεσαίου μεγέθους εταιρείες που προηγουμένως δεν είχαν ρεαλιστική πορεία προς την ανάπτυξη ΤΝ μπορούν τώρα να δημιουργήσουν και να αναπτύξουν τα δικά τους μοντέλα, αποφεύγοντας την εξάρτηση από τη Silicon Valley. Και αυτό είναι μόνο η αρχή.
Η DeepSeek απέδειξε ότι η καινοτομία της τεχνητής νοημοσύνης δεν εξαρτάται μόνο από τους οικονομικούς πόρους, αλλά από την εφευρετικότητα, την προσαρμοστικότητα και το στρατηγικό όραμα.
Η ιστορία έχει ξαναδεί τέτοιες στιγμές. Στα μέσα του 15ου αιώνα, η τυπογραφική μηχανή του Γουτεμβέργιου έσπασε το μονοπώλιο των γραφιάδων και των λογίων, αποσπώντας τον έλεγχο του γραπτού λόγου από τα χέρια της ελίτ και καθιστώντας τον διαθέσιμο στις μάζες. Οι συνέπειες ήταν βαθιές: η γνώση εξαπλώθηκε, ακολούθησαν επιστημονικές επαναστάσεις και οι οικονομίες μεταμορφώθηκαν.
Τώρα, η ιστορία μπορεί να επαναληφθεί. Ο διευθύνων σύμβουλος της DeepSeek, Liang Wenfeng, έχει ίσως γίνει ένας σύγχρονος Προμηθέας, παίρνοντας τη φωτιά της τεχνητής νοημοσύνης από τους λίγους και κάνοντάς την προσιτή στους πολλούς.
Υπάρχουν σημεία καμπής στην ιστορία όπου η τεχνολογική πρόοδος επιταχύνεται και οι δομές εξουσίας μετατοπίζονται. Η 27η Δεκεμβρίου 2024, η ημέρα δημοσίευσης της ερευνητηκής εργασίας πάνω στην οποία στηρίχτηκε το DeepSeek-V3, μπορεί κάλλιστα να μείνει στην ιστορία ως ένα από αυτά.
του Δημήτρη Ηρακλέους