מודל DeepSeek שובר הנחות יסוד לגבי ה-AI

שמואל קצביאן, אסטרטג שווקים פיננסיים בבנק דיסקונט

28/01/2025

עיקרי הדברים: המודלים של DeepSeek בתחום הבינה מלאכותית יוצרים זעזוע בשוק המניות, אולם בניתוח המצב עד כה ולאור התגובות מצד חברות וגורמים אמריקאיים - אנו מעריכים כי מדובר בהתפתחות חיובית נטו לכלכלה ולתחום ה-AI.

אנו מעריכים כי שוק המניות האמריקאי (המדד הכללי) לא יפגע לאורך זמן מחדשות אלו, אך יהיה שינוי ביחסי הכוחות ובגישה של חברות הטק הגדולות לגבי תחום ה-AI.

להערכתנו יהיו סקטורים ותתי סקטורים שייהנו מהחדשות האחרונות (פירוט בסקירה) גם בארה"ב.

נדגיש כי ההערכות שלנו מבוססות על ההנחה כי העלויות לפיתוח/אימון וסוג השבבים שבהם נעשה שימוש על ידי DeepSeek הן בהתאם להצהרות שנשמעו מצד החברה וגורמים נוספים (זו שאלת המפתח).

החדשות סביב מודל הבינה המלאכותית של DeepSeek ממשיכות "לתפוס כותרות" , כשבינתיים התפרסמו הצהרות וניתוחים של גורמים שונים בנושא ויש מעט יותר מידע בעניין.

להלן סיכום קצר בנקודות של הנושאים החשובים להערכתנו:

תזכורת קצרה: מי זו DeepSeek ומה הסיפור סביב פיתוח ה-AI שלה?

DeepSeek היא חברת סטראטאפ סינית שנוסדה ע"י קרן גידור סינית. ב-20 בינואר החברה שחררה מספר מודלים של AI ובהם DeepSeek-R1. המודל הציג ביצועים הניתנים להשוואה (בדרך כלל) למודלים קיימים של חברות במערב. היתרון הגדול הוא שלדברי החברה נעשתה השקעה של 5.6 מיליון דולר בלבד ותוך 55 ימי אימון (במודל V3 שהושק עוד בדצמבר) וזאת תוך שימוש בשבבים חלשים יחסית.

נזכיר כי תחום ה-AI "תופס כותרות" מזה זמן רב ותמך בעליות החדות בשוקי המניות בארה"ב בשנים האחרונות ובפרט של חברות הביג טק. התחום גם היווה והיווה אינטרס לאומי -ביטחוני של ארה"ב וצפויה להיות לו השפעה על לא מעט תחומים.

אלו הנחות יסוד נשברות בהשקת המודלים של DeepSeek?

העניין המרכזי הוא לא יכולות ה-AI של DeepSeek, אלא בעיקר דרישה מתונה יותר של משאבים (תקציבים/שבבים) שבהם יש צורך בתחום ה-AI.

עניין זה מערער את הגישה שפיתוח הבינה מלאכותית דורש תקציבים עצומים ושבבים מתקדמים ועשוי לערער את השליטה של חברות כמו Nvidia בשוק , או לפחות לשנות את הגישה וכח התמחור שלה לאורך זמן.

ניתן למנות למשל מספר הבדלים בין DeepSeek לבין חלק גדול מהמודלים הקיימים-להלן חלק מהם:

לדברי DeepSeek התקציב שנדרש לאימון ופיתוח היה נמוך יחסית.

זאת לעומת מאות מיליונים ויותר שנדרשו לצורך פיתוח ואימון המודלים המערביים. כך למשל עלויות פיתוח ואימון ChatGPT-4 היו בין 100 ל-200 מיליון דולר, לעומת כ-6 מיליון דולר במודל V3 של DeepSeek.

החברה עשתה שימוש בכמות קטנה יותר של שבבים. לפי הדיווחים DeepSeek-V3 עשתה שימוש בשלב האימון ב-2,048 שבבי H800 (לא הכי מתקדמים) של אינבידיה.
לצורך ההשוואה ChatGPT-4 הצריך 30,000 שבבים (של A100).

היתרונות של DeepSeek מתבטאים גם בצריכת אנרגיה נמוכה יותר ויכולת לפעול על מערכות מחשוב זמינות מקומיות (לפי הדיווחים והידוע כעת).

נגישות הקוד הפתוח. המודל של DeepSeek הינו בקוד פתוח, כלומר הוא ניתן לשימוש, גמישות והתאמה אישית. עניין זה מאתגר מודלים של AI בקוד סגור ומאפשר גישה מותאמת יותר לארגונים קטנים/בינוניים, שיפור מתמיד ואימוץ רחב יותר של הקוד.

מהן שאלות המפתח לגבי DeepSeek?

השאלה העיקרית היא האם המשאבים/עלויות ששימשו את DeepSeek הם אכן כפי שדווח, מבחינת סוג וכמות השבבים ועלויות האימון והפיתוח.

ישנם מומחים הטוענים כי חברת DeepSeek לא מגלה את הנתונים האמיתיים בנושא והעלויות/כמות השבבים בשימוש הינן שונות באופן משמעותי.

במידה והמשאבים ששימשו את החברה הם אכן בדומה למה שידוע כעת- השאלה הבאה (והקלה יותר..) היא האם הגישה של DeepSeek אכן ניתנת להרחבה ברמה גלובלית.

להערכתנו התשובה כאן תהיה חיובית. נציין כי נכון ל-27 ינואר האפליקציה של DeepSeek הגיעה לראש הטבלה בחנות האפליקציות של אפל הן בארה"ב והן בבריטניה ולהערכתנו ובמידה והמידע שפורסם נכון- האימוץ שלה ילך ויתרחב.

מההצהרות האחרונות של גורמים במערב ניתן להבין (נכון לידוע כעת) כי אכן יש כאן Game Changer בתחום ה-AI כשההתייחסות למודל של DeepSeek דווקא חיובית בהקשר הכללי ולא מעידה על "מלחמה" בגישה של DeepSeek.

נשיא ארה"ב, שידוע בגישתו התומכת בחברות ויצור אמריקאי הכריז אתמול כי הטכנולוגיה הסינית צריכה לשמש זרז עבור חברות אמריקאיות וטוב שחברות בסין מצאו שיטה זולה ומהירה יותר לבינה מלאכותית. הנשיא תיאר את המצב כ"חיובי, כנכס" ואמר כי "במקום להוציא מיליארדים ומיליארדים, תוציא פחות, ותגיע עם , בתקווה, אותו פתרון",

מדען הבינה המלאכותית הראשי של Meta ציין כי ההנחה הגדולה ביותר מהצלחתה של DeepSeek איננה האיום הגובר מצד התחרות הסינית, אלא שמירת הערך של AI כקוד פתוח, כך שכל אחד יוכל להרוויח. נזכיר כי חלק המודלים AI של Meta (כמו Llama 2) הם בעצמם קוד פתוח.

סם אלטמן, מנכ"ל ומייסד שותף של OpenAI ציין כי דגם R1 הינו מרשים וציין כי "זה לגיטימי וממריץ שיש מתחרה חדש". מיותר לציין כי ה-ChatGPT של OpenAI מאוים למעשה על ידי DeepSeek.

ואולי ההמחשה הבולטת ביותר: הדובר של חברת אינבידיה (שירדה אתמול ב-17% על רקע החדשות סביב DeepSeek) לא תקף את DeepSeek – אלא דווקא שיבח אותה, למרות שהיא מהווה (לפי ההנחות כעת) איום מרכזי מאוד על הביקושים לכמות גדולה של שבבים יקרים של אינבידיה.

לפי הדובר של אינבידיה מודל ה-R1 של DeepSeek מהווה "התקדמות מצויינת של AI". הודגשה הגישה החדשנית של אינבידיה וצוין כי העבודה של DeepSeek מדגימה כיצד ניתן ליצור מודלים חדשים ביעילות.

אינבידיה גם אמרה שה-GPUs שבהם השתמשה DeepSeek היו תואמים למגבלות היצוא, עניין שמוריד לחץ מסוים מהחששות להפרת כללי היצוא לסין (מה שהיה מגביר מתיחות בין ארה"ב לסין).

מה תהיה ההשפעה של המודלים של DeepSeek ברמת המאקרו ועולם ההשקעות?

בהנחה וכל הידוע עד כה אכן נכון - הרי שלהערכתנו ההוצאות ההוניות של החברות הגדולות על תחום השבבים יתמנו בראיה ארוכת טווח.

ברמת המאקרו בארה"ב/בעולם/בישראל החדשות תומכות בהתרחבות החדירה של AI לחברות שונות והן יאפשרו רמה נמוכה יותר של הוצאות הון על AI פר רמה נתונה של צרכים עסקיים.

יחד עם זאת ,ובוודאי שבשלב זה, התפתחויות אלו לכשעצמן לא מאתגרות באופן משמעותי (אם בכלל) כלפי מטה את האינפלציה הגלובלית או המקומית לצרכן מאחר והללו הושפעו בעיקר מתחומים כמו דיור או מגבלות היצע (בישראל בהשפעת המלחמה) שפחות קשורות לתחום ה-AI.

ברמת שוק המניות בכללו אנו מעריכים כי הגישה החדשה של DeepSeek לא תעיק על שוק המניות האמריקאי לאורך זמן, אלא תשנה את יחסי הכוחות בין החברות השונות ותגרום להם לשנות את הגישה שלהם לגבי תחום ההשקעות ב-AI (ושבבי AI).

תגובת השוק אתמול שוב מעידה על הצורך בתיק מניות מפוזר וזהירות מאחזקות יתר בחברות כמו אינבידיה. כדאי לשים לב למשל שבעוד שאינבידיה נפלה אתמול ב-17%, מטא (לשעבר פייסבוק) עלתה ב-1.9%. יתכן וזאת גם עקב הערכות כי החברה תתאים את עצמה וחלק מהמודלים שלה (כמו Llama) לפיתוח הזול יחסית של DeepSeek, עניין שעשוי להוזיל חלק מההשקעות המתוכננות.

להערכתנו ההתפתחויות יורידו את חסמי הכניסה ויאפשרו לחברות בינוניות/קטנות יותר להשקיע ב-AI ובפרט על רקע ההתמתנות הצפויה בעתיד בהשקעות גבוהות, עניין שנגיש יותר לחברות הגדולות.

ברמת הסקטורים בארה"ב סקטורים כמו צריכה בסיסית ובריאות פחות יפגעו , ולאורך זמן אף ייהנו מהחדשות האחרונות לגבי ה-AI של DeepSeek.

ברמת תתי הסקטורים הגישה החדשה של DeepSeek עשויה לתמוך בחברות פרסום (גישה זולה יותר ל-AI ביישומי פרסום), חברות נסיעות ותיירות , חברות צריכה העושות שימוש בבינה מלאכותית , חברות למסחר אלגוריתמי /טכנולוגיה פיננסית וככל הנראה גם סטארטאפים קטנים שיעשו שימוש במודלים/קוד של DeepSeek.

ברמה גלובלית ענקיות הטק הסיניות/בשווקים המתפתחים צפויות לאמץ את הגישה והמודלים של DeepSeek . קרנות סל מעניינות בתחום הם למשל KWEB (מניות אינטרנט/קשורות לאינטרנט בסין).