Το DeepSeek, η κινεζική start up, κυκλοφόρησε ένα νέο μοντέλο Τεχνητής Νοημοσύνης (ΑΙ) προκαλώντας πονοκέφαλο στη Wall Street και προβληματισμό στον κλάδο της Τεχνολογίας. Πρόκειται για ένα αναβαθμισμένο, χαμηλού κόστους, μοντέλο AI που θεωρείται ότι έχει εκπληκτικά αποτελέσματα.
Το νέο μοντέλο AI αναπτύχθηκε από την DeepSeek, μια startup που γεννήθηκε μόλις πριν από ένα χρόνο και κατάφερε με κάποιο τρόπο μια σημαντική ανακάλυψη που ο διάσημος επενδυτής τεχνολογίας Marc Andreessen ονόμασε «στιγμή του AI Sputnik»: το R1 μπορεί σχεδόν να ανταποκριθεί στις δυνατότητες των πολύ πιο διάσημων αντιπάλων του, συμπεριλαμβανομένου του GPT-4 του OpenAI, του Llama του Meta και του Gemini της Google.
Η εταιρεία είπε ότι είχε ξοδέψει μόλις 5,6 εκατομμύρια δολάρια για την τροφοδοσία του βασικού της μοντέλου AI, σε σύγκριση με τα εκατοντάδες εκατομμύρια, αν όχι δισεκατομμύρια δολάρια που ξοδεύουν οι αμερικανικές εταιρείες για τις τεχνολογίες τεχνητής νοημοσύνης τους. Αυτό είναι ακόμη πιο σοκαριστικό αν σκεφτεί κανείς ότι οι Ηνωμένες Πολιτείες εργάζονται για χρόνια για να περιορίσουν την προμήθεια τσιπ τεχνητής νοημοσύνης υψηλής ισχύος στην Κίνα, επικαλούμενες ανησυχίες για την εθνική ασφάλεια. Αυτό σημαίνει ότι η DeepSeek υποτίθεται ότι ήταν σε θέση να επιτύχει το χαμηλού κόστους μοντέλο της σε σχετικά χαμηλής ισχύος τσιπ AI.
Τι είναι το DeepSeek;
Η εταιρεία, που ιδρύθηκε στα τέλη του 2023 από τον Κινέζο διαχειριστή hedge fund, Liang Wenfeng, είναι μία από τις δεκάδες startups που έχουν εμφανιστεί τα τελευταία χρόνια αναζητώντας μεγάλες επενδύσεις AI που έχουν οδηγήσει τη βιομηχανία της τεχνολογίας στα ύψη.
Όπως και άλλες νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης, συμπεριλαμβανομένων των Anthropic και Perplexity, η DeepSeek κυκλοφόρησε διάφορα ανταγωνιστικά μοντέλα τεχνητής νοημοσύνης κατά τη διάρκεια του περασμένου έτους που έχουν τραβήξει την προσοχή της βιομηχανίας. Το μοντέλο V3 αύξησε το ενδιαφέρον σχετικά με την εταιρεία, αν και οι περιορισμοί περιεχομένου γύρω από ευαίσθητα θέματα σχετικά με την κινεζική κυβέρνηση και την ηγεσία της πυροδότησε αμφιβολίες σχετικά με τη βιωσιμότητά της. Αλλά το R1 κυκλοφόρησε την περασμένη εβδομάδα και κέρδισε σημαντική προσοχή αυτή την εβδομάδα όταν η εταιρεία αποκάλυψε στο περιοδικό το συγκλονιστικά χαμηλό κόστος λειτουργίας του. Πρόκειται για ένα μοντέλο ανοιχτού κώδικα, πράγμα που σημαίνει ότι άλλες εταιρείες μπορούν να δοκιμάσουν και να βασιστούν σε αυτό για να το βελτιώσουν.
Γιατί τόσος ντόρος πίσω από το DeepSeek;
Η τεχνητή νοημοσύνη είναι μια δυναμική και δαπανηρή τεχνολογία — τόσο πολύ που οι πιο ισχυροί τεχνολογικοί ηγέτες της Αμερικής αγοράζουν εταιρείες πυρηνικής ενέργειας για να παρέχουν την απαραίτητη ηλεκτρική ενέργεια για τα μοντέλα τεχνητής νοημοσύνης τους. Η Meta την περασμένη εβδομάδα δήλωσε ότι θα δαπανήσει πάνω από 65 δισεκατομμύρια δολάρια φέτος για την ανάπτυξη AI. Ο Sam Altman, Διευθύνων Σύμβουλος του OpenAI, πέρυσι είπε ότι η βιομηχανία AI θα χρειαζόταν τρισεκατομμύρια δολάρια σε επενδύσεις για να υποστηρίξει την ανάπτυξη τσιπ υψηλής ζήτησης που απαιτούνται για την τροφοδοσία των κέντρων δεδομένων.
Έτσι, η αντίληψη ότι παρόμοιες δυνατότητες με τα πιο ισχυρά μοντέλα τεχνητής νοημοσύνης της Αμερικής μπορούν να επιτευχθούν με τόσο μικρό κόστος – και σε λιγότερο ικανά τσιπ – αντικατοπτρίζει τη ριζική αλλαγή για το πόσες επενδύσεις χρειάζονται στην τεχνητή νοημοσύνη. Η τεχνολογία έχει πολλούς σκεπτικιστές και αντιπάλους, αλλά οι υποστηρικτές της υπόσχονται ένα λαμπρό μέλλον: η τεχνητή νοημοσύνη θα προωθήσει την παγκόσμια οικονομία σε μια νέα εποχή, υποστηρίζουν, κάνοντας την εργασία πιο αποτελεσματική και ανοίγοντας νέες δυνατότητες σε πολλούς κλάδους που θα ανοίξουν το δρόμο για νέα έρευνα. Ο Andreessen, υποστηρικτής του Τραμπ και συνιδρυτής της εταιρείας επιχειρηματικών κεφαλαίων της Silicon Valley, Andreessen Horowitz, αποκάλεσε το DeepSeek «μία από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ», σε μια ανάρτηση στο X.
Εάν αυτή η δύναμη που μπορεί να αλλάξει τον κόσμο μπορεί να επιτευχθεί με σημαντικά μειωμένο κόστος, ανοίγει νέες δυνατότητες – και απειλές – στον πλανήτη.
Τι σημαίνει αυτό για την Αμερική;
Οι Ηνωμένες Πολιτείες σκέφτηκαν ότι θα μπορούσαν να επιβάλουν κυρώσεις για την κυριαρχία τους σε μια βασική τεχνολογία που πιστεύουν ότι θα συμβάλει στην ενίσχυση της εθνικής τους ασφάλειας. Μόλις μια εβδομάδα πριν αποχωρήσει από την εξουσία, ο πρώην Πρόεδρος Τζο Μπάιντεν διπλασίασε τους περιορισμούς στις εξαγωγές σε τσιπ υπολογιστών τεχνητής νοημοσύνης για να αποτρέψει ανταγωνιστές όπως η Κίνα από την πρόσβαση στην προηγμένη τεχνολογία. Αλλά το DeepSeek έχει αμφισβητήσει αυτή την ιδέα και απείλησε «την αύρα του αήττητου» που περιβάλλει την αμερικανική τεχνολογική βιομηχανία. Η Αμερική μπορεί να αγόρασε χρόνο με περιορισμούς στις εξαγωγές τσιπ, αλλά το προβάδισμα της τεχνητής νοημοσύνης απλώς συρρικνώθηκε δραματικά παρά αυτές τις ενέργειες. Το DeepSeek μπορεί να δείξει ότι η απενεργοποίηση της πρόσβασης σε μια βασική τεχνολογία δεν σημαίνει απαραίτητα ότι θα κερδίσουν οι Ηνωμένες Πολιτείες. Αυτό είναι ένα σημαντικό μήνυμα προς τον Πρόεδρο Ντόναλντ Τραμπ, καθώς ακολουθεί την απομονωτική πολιτική του «Πρώτα η Αμερική».
Η Wall Street ανησύχησε από την εξέλιξη. Η Nvidia, ο κορυφαίος προμηθευτής τσιπ τεχνητής νοημοσύνης, της οποίας η μετοχή υπερδιπλασιάστηκε τα δύο τελευταία χρόνια, υποχώρησε 12% στις συναλλαγές τη Δευτέρα. Η Meta και η Alphabet, η μητρική εταιρεία της Google, είδαν τις μετοχές τους να πέφτουν απότομα, όπως και η Marvell, η Broadcom, η Palantir, η Oracle και πολλοί άλλοι τεχνολογικοί γίγαντες.
Είμαστε πραγματικά σίγουροι ότι αυτό είναι μεγάλο ζήτημα στον χώρο της Τεχνολογίας;
Ο κλάδος δέχεται τον ισχυρισμό της εταιρείας για το χαμηλό κόστος του μοντέλου, κανείς στην ουσία δεν το αμφισβητεί, όμως, όσα συμβαίνουν στην αγορά εξαρτώνται από την αλήθεια που προβάλει μιας μεμονωμένη και σχετικά άγνωστη εταιρεία. Η εταιρεία δεν είπε πόσο κόστισε ακριβώς η έρευνα και η ανάπτυξη του μοντέλου. Ένα επίτευγμα μπορεί να μην είναι αρκετό για να αντιμετωπίσει την πολυετή πρόοδο στην αμερικανική ηγεσία της τεχνητής νοημοσύνης. Και μια μαζική στροφή πελατών σε μια κινεζική startup είναι απίθανη. «Η ανάπτυξη του μοντέλου DeepSeek οδηγεί τους επενδυτές να αμφισβητούν το προβάδισμα που έχουν οι αμερικανικές εταιρείες και πόσα δαπανώνται και εάν αυτές οι δαπάνες θα οδηγήσουν σε κέρδη (ή υπερβολικές δαπάνες)», δήλωσε ο Keith Lerner, αναλυτής στο Truist. «Τελικά, η άποψή μας είναι ότι η απαιτούμενη δαπάνη για δεδομένα στην τεχνητή νοημοσύνη θα είναι σημαντική και οι αμερικανικές εταιρείες παραμένουν ηγέτες».
Αν και το επίτευγμα εξοικονόμησης κόστους μπορεί να είναι σημαντικό, το μοντέλο R1 είναι ανταγωνιστής του ChatGPT — ένα μοντέλο που εστιάζει στον καταναλωτή. Δεν έχει ακόμη αποδείξει ότι μπορεί να χειριστεί μερικές από τις εξαιρετικά φιλόδοξες δυνατότητες τεχνητής νοημοσύνης για βιομηχανίες που –προς το παρόν– εξακολουθούν να απαιτούν τεράστιες επενδύσεις σε υποδομές.