Οι Πλούσιοι Λαγοί και η Απελπισμένη Χελώνα

Η ορκωμοσία του Ντόναλντ Τραμπ μονοπώλησε τη διεθνή επικαιρότητα, με τον νέο Αμερικανό Πρόεδρο να προχωρά σε μία σειρά άμεσων μεταρρυθμίσεων που τράβηξαν την προσοχή υποστηρικτών και επικριτών. Ίσως αυτός ο καταιγισμός ειδήσεων από την Ουάσιγκτον να ευθυνόταν για το γεγονός ότι μία άλλη είδηση πέρασε στα ψιλά: Η κυκλοφορία του DeepSeek R1 στις 20 Ιανουαρίου. Το DeepSeek R1 είναι η πιο πρόσφατη εκδοχή του μεγάλου γλωσσικού μοντέλου της ομώνυμης εταιρείας και έχει την ικανότητα συλλογισμού, δηλαδή μπορεί να “εξηγήσει” βήμα βήμα το πώς κατέληξε σε μία απάντηση. Η κυκλοφορία του συγκεκριμένου αλγορίθμου δεν θα άξιζε αναφοράς αν δεν επρόκειτο για την προέλευσή του: Το DeepSeek R1 σχεδιάστηκε από ένα άγνωστο κινεζικό start-up μέσα σε τρεις μήνες και κοστίζοντας λιγότερο από 6 εκατομμύρια δολάρια σύμφωνα με τους δημιουργούς του. Όπως καταδεικνύουν οι πρώτες δοκιμές από τους ανεξάρτητους χρήστες, το DeepSeek R1 ξεπερνά πολύ ακριβότερα δυτικά μοντέλα όπως το Claude της Anthropic και το Llama της Meta, ενώ προσεγγίζει τις ικανότητες της έκδοσης ο1 του Chat GPT. 

energia.gr
Δευ, 27 Ιανουαρίου 2025 - 08:34

Ωστόσο, αυτό που εντυπωσίασε περισσότερο τους γνώστες της αγοράς ήταν πως το DeepSeek R1 κυκλοφόρησε δωρεάν και με ανοιχτό κώδικα, επιτρέποντας στους χρήστες να έχουν ελεύθερη πρόσβαση ώστε να το δοκιμάσουν.

Η άφιξη του DeepSeek R1 εξέπληξε μεν ευχάριστα τους απλούς χρήστες, αλλά δημιούργησε σύννεφα πάνω από τη Silicon Valley. Το DeepSeek R1 δεν λειτουργεί μόνο ως ένας ακόμη ανταγωνιστής των υφιστάμενων μοντέλων, προσφέροντας καλύτερες επιδόσεις, αλλά θέτει υπό αμφισβήτηση ολόκληρο το επιχειρηματικό πλάνο των περισσότερων εταιρειών ΑΙ. Οι αμερικανικοί αυτοί κολοσσοί επενδύουν εκατοντάδες εκατομμύρια ή και δισεκατομμύρια δολάρια προκειμένου να βελτιώσουν τους αλγορίθμους τους, ενώ χρειάζονται δεκάδες χιλιάδες κάρτες γραφικών για να λειτουργήσουν. Ο μεγαλύτερος υπερυπολογιστής ΑΙ στον κόσμο, ο Colossus ιδιοκτησίας Έλον Μασκ, χρησιμοποιεί 100.000 κάρτες γραφικών (GPUs), και σχεδιάζεται να επεκταθεί σταδιακά στις 200.000. Η ανακοίνωση της DeepSeek ανέφερε πως χρησιμοποίησαν μόλις 2.048 GPUs.

Το ζήτημα αυτό μπορεί να φαίνεται ως μία ασήμαντη τεχνική λεπτομέρεια, αλλά ενδεχομένως να αποδειχθεί εξαιρετικά κρίσιμο όσον αφορά τον τεχνολογικό και εμπορικό ανταγωνισμό μεταξύ ΗΠΑ και Κίνας. Το εντυπωσιακό με τη DeepSeek δεν είναι μόνο ο μικρός αριθμός GPUs που ισχυρίζεται ότι χρησιμοποίησε, αλλά το γεγονός ότι τα εξαρτήματα αυτά δεν είναι τα πιο προηγμένα στον χώρο. Εξαιτίας των περιορισμών που έχει επιβάλει η Ουάσιγκτον στις εξαγωγές εξαρτημάτων προς την Κίνα, τα GPUsαυτά είναι πολύ πιο αργά, ενώ πλέον δεν πωλούνται καν προς Κινέζους αγοραστές. Πριν την απαγόρευσή τους, ο ιδιοκτήτης της DeepSeek είχε αγοράσει ορισμένες χιλιάδες εξαρτήματα— τα κινεζικά ΜΜΕ υπολογίζουν πως η εταιρεία διαθέτει περίπου 10.000 GPUs, ενώ ορισμένοι δυτικοί αναλυτές εκτιμούν πως μπορεί να έχουν αποθέματα ως και 50.000 GPUs. Αν και ο πραγματικός αριθμός των GPUsπου χρειάζονται για να λειτουργήσει το DeepSeek είναι σημαντικός και τα αποθέματα της εταιρείας θα κρίνουν τη μελλοντική εξέλιξη του μοντέλου σε σχέση με τους ανταγωνιστές του, η επιτυχία του αναδεικνύει ακόμα ένα θέμα.

Η DeepSeek κατάφερε να δημιουργήσει ένα μοντέλο που λειτουργεί εξίσου καλά με τα δυτικά παρά τους περιορισμούς των ΗΠΑ σχετικά με τις εξαγωγές εξαρτημάτων. Όπως εξηγούν αρκετοί ειδικοί στην ανάπτυξη της ΑΙ, αυτή η επιτυχία αποδεικνύει πως οι Κινέζοι ερευνητές μπορούν να αξιοποιήσουν τις τεχνικές δυνατότητες του εξοπλισμού που διαθέτουν με πολύ μεγαλύτερη αποτελεσματικότητα από τους δυτικούς ανταγωνιστές τους. Όπως λέει η λαϊκή σοφία, «η ανάγκη είναι η μητέρα της εφεύρεσης». Αντί να σταματήσουν, ή έστω να επιβραδύνουν την κινεζική καινοτομία, οι αμερικανικοί περιορισμοί μάλλον έχουν ενισχύσει τη θέληση των Κινέζων να βρουν τρόπους να γίνουν πιο αποδοτικοί σε θέματα τεχνολογίας, με απώτερο στόχο την αυτάρκεια, τόσο στον τομέα του εξοπλισμού, όσο και στο θέμα της ΑΙ. Χαρακτηριστικά, ο πρώην CEO της Google, Έρικ Σμιντ, είχε δηλώσει τον προηγούμενο Μάιο πως οι ΗΠΑ «βρίσκονται 2 ή 3 χρόνια μπροστά από την Κίνα» στα ζητήματα ΑΙ, εξηγώντας πως μία τέτοια διαφορά ισούται με μία αιωνιότητα. Τον Νοέμβριο αναγκάστηκε να ανασκευάσει, λέγοντας πως η εξέλιξη των κινεζικών εταιρειών τον σόκαρε και πως οι περιορισμοί της Ουάσιγκτον δεν επαρκούν.

Η διαφορά αυτή οφείλει να ανησυχήσει ιδιαίτερα τους Αμερικανούς, τόσο στην Ουάσιγκτον, όσο και στη Silicon Valley. Μολονότι οι κινεζικές επιχειρήσεις του κλάδου δεν έχουν καταφέρει ακόμα να παράξουν GPUs αντάξια των δυτικών, το Πεκίνο είναι αποφασισμένο να χρηματοδοτήσει εγχώριους κολοσσούς, όπως τη Huawei, ή startups, όπως η Biren Technology, προκειμένου να κλείσει την ψαλίδα. Με την απάντηση της Ουάσιγκτον να αναμένεται, οι πρώτες αντιδράσεις στη Silicon Valley προκάλεσαν προβληματισμό. Και αυτό γιατί πέρα από τις πληροφορίες ότι οι προγραμματιστές στις αμερικανικές εταιρείες έπαθαν σοκ με την ταχύτατη ανάπτυξη της κινεζικής ΑΙ όταν δοκίμασαν το DeepSeek R1, τα μεγάλα αφεντικά φαίνονται να έχουν άλλες προτεραιότητες. Ο Έλον Μασκ, η πιο θορυβώδης προσωπικότητα στον χώρο της τεχνολογίας και στενότατος σύμβουλος του Ντόναλντ Τραμπ, προτίμησε να επιτεθεί διαδικτυακά στο σχέδιο επένδυσης 500 δισεκατομμυρίων δολαρίων που ανακοίνωσε ο Πρόεδρος των ΗΠΑ και περιλαμβάνει την Open AI, την οποία διοικεί ο πάλαι ποτέ συνεργάτης και σημερινός εχθρός του, Σαμ  Άλτμαν, παρά να ενημερώσει τους επενδυτές για το πού βρίσκονται τα αμερικανικά μοντέλα ΑΙ ή να προτείνει τρόπους ώστε οι αμερικανικές επιχειρήσεις να καταστούν πιο αποδοτικές λειτουργικά.

Διαβάστε ακόμα