מאת ליאור ברק, Officer Business Chief, תשתיות מחשוב על Stream11
בשבוע האחרון קיבלנו ב-Stream11 עשרות פניות מלקוחות ושותפים עסקיים שהתעניינו בהשלכות של כניסת DeepSeek לעולם חוות השרתים. השאלה המרכזית שעלתה היא האם המעבר למודלים חסכוניים במשאבים ישפיע על תעשיית חוות השרתים.
בקצרה: חברת DeepSeek הסינית השיקה בשבוע שעבר את מודל הבינה המלאכותית DeepSeek-R1 והצליחה לזעזע את השוק. בעקבות ההכרזה, מדד הנאסד"ק ירד ב-3% ביום שני, כאשר מניית Nvidia – יצרנית השבבים המרכזית למודלי בינה מלאכותית – צנחה בכמעט 17% וטרם התאוששה.
DeepSeek הוא מודל בינה מלאכותית חדשני שפותח בסין, המסוגל לבצע עיבוד שפה טבעית (NLP) ברמה גבוהה, תוך שימוש במשאבי חישוב מוגבלים יחסית בהשוואה למודלים מערביים. החידוש המרכזי שלו הוא יכולתו לספק ביצועים מרשימים למרות מגבלות בגישה לשבבים המתקדמים ביותר.
הסיבה לזעזוע בשוק נעוצה בשילוב של עלות נמוכה וביצועים המתחרים במובילי השוק. מחקר שפורסם עם השקת המודל חשף כי עלות האימון של DeepSeek-R1 הייתה 6 מיליון דולר בלבד – סכום נמוך משמעותית בהשוואה לעלויות המוערכות של מודלים מובילים כמו ChatGPT של OpenAI או Gemini של Google. מאז השקתו ב-20 בינואר, על פי עדויות מהשטח, DeepSeek-R1 מציג ביצועים מצוינים המתחרים במודלים הגדולים ביותר.
המשמעות מרחיקת הלכת היא שאין הכרח להשקיע הון עתק או להשתמש בשבבים המתקדמים ביותר כדי להשיג תוצאות איכותיות, מה שמעמיד בסימן שאלה את הצורך בהשקעות ובהסתמכות על חומרה יקרה.
מודל איכותי במחיר נמוך במיוחד
DeepSeek-R1 מציע עלויות שימוש נמוכות משמעותית בהשוואה למתחרים:
– העלאת מיליון טוקנים עולה 55 סנט בלבד
– הורדת מיליון טוקנים עולה 2.19 דולר
[הערת הסבר: טוקן בהקשר של עיבוד שפה טבעית הוא יחידה קטנה של טקסט (כגון מילה או תו), המשמשת את האלגוריתמים של למידת מכונה.]
לשם השוואה: Grok ו-ChatGPT-10 Mini הם מהיקרים ביותר. Gemini 1.5 Pro ו-Nova Pro זולים יותר, אך עדיין יקרים משמעותית. Llama 3.1 גם זול מאוד, אך יקר מעט יותר מ-DeepSeek-R1, שהוא הזול ביותר מכולם.
DeepSeek-R1 מוכיח שאפשר לפתח מודל חזק בעלות נמוכה ובשימוש בחומרה פשוטה יחסית. אין ספק ש-DeepSeek הפכה לשחקנית משמעותית בשוק, עם פוטנציאל לערער את מעמדן המוביל של OpenAI, Google ו-Nvidia.
ההשלכות עשויות להיות דרמטיות. אם התחזיות יתממשו, ואלפים ברחבי העולם כבר בוחנים זאת מאז הפרסום, החברות יצטרכו לחשב מחדש את האסטרטגיה שלהן בעולם שבו בינה מלאכותית איכותית הופכת לזולה ונגישה יותר.
המגבלות שהכותרות מפספסות
בניגוד לכותרות המבטיחות, DeepSeek עדיין תלויה בחומרה רבה. אף שהמודל פותח עם משאבים מוגבלים יחסית, המפתחים הודו כי קיים פער של פי ארבעה בכוח העיבוד לעומת מתחרים מובילים. בתהליך הכשרתו, DeepSeek השתמש ב-50,000 יחידות GPU מסוג H800, עם תמיכה נרחבת מספקי ענן סיניים וזרים. הכשרת המודל דרשה כוח חישובי עצום לניסויים.
דרישות המינימום להמשך פיתוח בינה מלאכותית
למרות החדשנות של DeepSeek, השימוש במודלים עתידיים ידרוש תשתיות חזקות יותר. כיום, הסטנדרט הבסיסי להפעלת מודלים כאלה מבוסס על GPU עוצמתיים יותר:
– H800 – צריכת חשמל של 350 ואט לכל GPU (כ-30-60 קילו-ואט לארון שרתים)
– H200/MI300X – צריכת חשמל של 700-750 ואט לכל GPU (כ-60 קילו-ואט לארון)
– GB200/MI325X – צריכת חשמל של 1,000 ואט לכל GPU (כ-100-140 קילו-ואט לארון, וצפוי לגדול בעתיד הקרוב)
מאבק השליטה במחשוב העל: ארצות הברית מול סין
מנכ"ל OpenAI, סם אלטמן, התייחס למודל הבינה המלאכותית DeepSeek-R1 והגדיר אותו כ"מרשים". המודל מציע ביצועים טובים בעלויות נמוכות משמעותית מהמקובל בתעשייה. עם זאת, אלטמן מדגיש כי כוח מחשוב רב עדיין הכרחי להצלחה בטווח הארוך.
הדיון על עלות מול איכות מתחדד – האם השקעות הענק של OpenAI והצורך בכוח מחשוב עצום מוצדקים? DeepSeek מציגה מודל חסכוני המאתגר את הגישה המסורתית הדוגלת בכמות נתונים וכוח חישוב אדירים.
התפתחויות בישראל בתחום ה-GPU
אנחנו ב-Stream11 עוקבים ועובדים עם ספקי GPU-as-a-Service בישראל, באירופה ובשאר המזרח התיכון. ישראל מתקדמת בצעדים מדודים אחרי העולם. כיום נבנות חוות שרתים התומכות בצורכי בינה מלאכותית, ועם החברות הטכנולוגיות והמוחות המובילים שיש לישראל להציע, אנו עומדים בפתחה של תקופה משמעותית.
חדשות נוספות מישראל
רשות החדשנות פרסמה קול קורא להקמת מעבדה והנגשתה לאימון מודלים גדולים להאצת מחקרי בינה מלאכותית. במקביל, NVIDIA, שרכשה את חברת הבינה המלאכותית הישראלית Run:ai (ששווייה מוערך בכ-700 מיליון דולר), הודיעה כי תרחיב את פעילות המחקר והפיתוח שלה בישראל עם אתר חדש בשטח 10,000 מ"ר ליד יקנעם, בהספק של 30 מגה-ואט.
סיכום
חברת DeepSeek היא שחקנית חדשה יחסית בשוק הבינה המלאכותית, בעלת פוטנציאל משמעותי לצד סימני שאלה רבים סביב יכולותיה. בהיותה חברה צעירה, עדיין מוקדם להעריך את מידת הסקלביליות של המודל שלה ואת התאמתו לשימושים רחבים במחשוב-על. נכון לעכשיו, ההכרזות מצביעות על שאיפות גבוהות, אך יש לעקוב אחר היישום בפועל ולבחון את התפתחותה בשנים הקרובות.
אתגרים גיאופוליטיים
אחד האתגרים המרכזיים של DeepSeek נוגע למגבלות גיאופוליטיות. סביר שחלק מהמדינות, במיוחד בשווקים מערביים, יגבילו את השימוש ב-GPU סיני, אם מטעמי אבטחת מידע ואם כחלק ממדיניות הסחר שלהן. כיום אין ודאות לגבי השפעת שיקולים אלה על חברות בינלאומיות, ונדרש מעקב מתמיד אחר התפתחות הנושא.
השפעה על המחירים והשווקים
שוק ה-GPU מתנהל באופן דינמי ומגיב לתנודות בהיצע ובביקוש. גם אם כניסת DeepSeek תשפיע על המחירים, ניסיון העבר מלמד שההשפעה בשלב זה תהיה מוגבלת, שכן השוק נוטה להתאזן בהתאם לצמיחה בענף ולהתפתחויות טכנולוגיות. עם העלייה בביקוש לשירותי מחשוב-על ו-GPU מתקדמים, השוק צפוי להתרחב באופן טבעי, תוך התאמה לתחרות ולשחקנים החדשים.
השפעה על חוות שרתים
ככל שמחירי ה-GPU יהיו נגישים יותר, סביר שהשימוש יגדל, ובהתאמה תגדל הדרישה לחוות שרתים. Stream11 תמשיך לעקוב אחר ההתפתחויות בענף, כולל סביב DeepSeek. בשלב זה, חשוב לשמור על גישה זהירה ולנטר את התקדמות DeepSeek, הן מבחינת יכולתה לעמוד בציפיות הטכנולוגיות והן בהיבטי הרגולציה והאימוץ הבינלאומי.
















