סרבראס מערכות
| נתונים כלליים | |
|---|---|
| מייסדים | אנדרו פלדמן, גארי לאוטרבאך, מייקל ג'יימס, שון לי וז'אן-פיליפ פריקר |
| תקופת הפעילות | 2016–הווה (כ־10 שנים) |
| מדינה | ארצות הברית |
| מיקום המטה | סן פרנסיסקו, סאניווייל |
| ענפי תעשייה | תעשיית המוליכים למחצה, בינה מלאכותית |
| שווי שוק | 53.08 מיליארד דולר (26 במאי 2026) |
| מנכ"ל | אנדרו פלדמן |
| https://www.cerebras.ai/ | |
סרבראס מערכות (באנגלית: Cerebras Systems) היא חברת היי-טק המפתחת מוליכים למחצה, מחשבי-על ותוכנות קשורות להפעלת יישומי למידה עמוקה של בינה מלאכותית. בין מוצריה נמנים מוליכים למחצה מסוג Wafer Scale Engine (WSE) 3, מחשבי-על מסוג CS-3, וממשקי ה-API שלה, "AI inference cloud" ו-"AI training cloud", המאפשרים למשתמשים גישה לכוח המחשוב של החברה מבלי לרכוש את החומרה שלה. החברה גם בונה מרכזי נתונים של המעבדים ומחשבי-העל שלה כדי לספק שירותי מחשוב ענן ישירות ללקוחות. מטה החברה שוכן בסאניווייל, קליפורניה.
במידות של 215 מ"מ (8.5 אינץ') רבועים, מוליכי־העל למחצה מדגם WSE-3 של סרבראס הם שבבי הבינה המלאכותית הגדולים ביותר שנבנו. הם תופסים פרוסת סיליקון שלמה ומשתמשים באינטגרציה בקנה־מידה של פרוסה (wafer-scale integration) וב־switched fabric. הדבר מפחית זמן השהיה וצווארי בקבוק בתקשורת בין רכיבים בהשוואה לאשכולות GPU.
הם משתמשים בזיכרון SRAM (זיכרון סטטי בעל גישה אקראית) במקום DRAM (זיכרון דינמי בעל גישה אקראית). השבבים ומערכות המחשוב של סרבראס חזקים משמעותית משל המתחרים, עם זאת, יש להם גם חסרונות הנובעים מגודלם העצום, צריכת חשמל של כ־25 קילוואט, ועלות שיכולה להגיע עד כ־3 מיליון דולר לכל צומת (אנ').
לחברה ארבעה לקוחות עיקריים: אוניברסיטת מוחמד בן זאיד לבינה מלאכותית (62% מהכנסות בשנת 2025), G42 (24% מהכנסות בשנת 2025), OpenAI (נחתם ב-2026) ו-Amazon Web Services (נחתם ב-2026).
לסרבראס משרדים בסאניווייל, סן דייגו, טורונטו ובנגלורו. המוליכים למחצה שלה מיוצרים בבלעדיות על ידי TSMC.
המתחרים העיקריים של החברה בחומרה שלה הם אנבידיה, AMD, אינטל וברודקום. המתחרים העיקריים של החברה לשירותי מחשוב הענן שלה הם Amazon Web Services, Microsoft Azure, Google Cloud Platform, אורקל ו-CoreWeave.
במאי 2026 הפכה סרבראס לחברה ציבורית באמצעות הנפקה ראשונה לציבור, וגייסה 5.55 מיליארד דולר על ידי מכירת מניות לפי שווי של כ־56 מיליארד דולר.[1]
היסטוריה
סרבראס נוסדה בשנת 2015 על ידי אנדרו פלדמן, גארי לאוטרבאך, מייקל ג'יימס, שון לי וז'אן-פיליפ פריקר.[2] חמשת המייסדים הללו עבדו יחד ב-SeaMicro, שהוקמה בשנת 2007 על ידי פלדמן ולאוטרבאך ונמכרה ל-AMD בשנת 2012 תמורת 334 מיליון דולר.[3]
מייסדי סרבראס הבינו שמעבדי GPU רגילים אינם הפתרון האידיאלי לחישובי בינה מלאכותית מתקדמים. כדי לבנות שבב עצום בגודל של פרוסת סיליקון שלמה הם תכננו מערכות קירור ייחודיות שימנעו מהשבב להתחמם ולהישרף תחת צריכת חשמל עצומה, ליצור תוכנה המסוגלת לזהות ולעקוף פגמי ייצור מיקרוסקופיים הקיימים כמעט בכל פרוסה, ואף להמציא מכונה מיוחדת שמבריגה 40 ברגים בו־זמנית אל השבב, כדי למנוע הפעלת לחץ לא אחיד שעלול לגרום לסדיקת הסיליקון השביר.[4][5]
החברה התקשתה לפתור את בעיית האריזה והאינטגרציה של המעגל המשולב, כיצד לחבר את שבב הסיליקון ללוח האם, כיצד לספק לו חשמל, וכיצד להתמודד עם החימום, הקירור, ותשתיות התקשורת שמעבירות אליו וממנו נתונים. במהלך הפיתוח הוציאה החברה כ־8 מיליון דולר בחודש, ובסך הכל כ־200 מיליון דולר בניסיון לפתור את הבעיות הללו. ביולי 2019, לאחר תהליך ממושך של ניסוי וטעייה, הצליחה החברה סוף־סוף לייצר מוצר שעבד.[5]
באוגוסט 2019 הכריזה Cerebras על WSE-1, מוליכים למחצה מדגם Wafer-Scale Engine (WSE) מהדור הראשון שלה, ועל מערכת מחשוב העל CS-1 שלה.[6][7][8] ה-CS-1 הוא מכשיר בגודל 19 אינץ' המותקן על מדף וכולל מעבד ראשי WSE יחיד עם 400,000 ליבות עיבוד, 1.2 טריליון טרנזיסטורים, שנים־עשר חיבורי Ethernet במהירות של 100 גיגה־ביט לשנייה, ו־18 גיגה־בייט של זיכרון מהיר במיוחד.[6]
באפריל 2021 השיקה סרבראס את מערכת CS-2, המבוססת על הדור השני של מעבדי Wafer Scale Engine (WSE-2). השבב מיוצר בתהליך של 7 ננומטר על ידי TSMC ונחשב לאחד ממעבדי הבינה המלאכותית המתקדמים והשאפתניים ביותר שפותחו באותה תקופה.
מערכת CS-2, שגובהה כ־66 ס"מ, תופסת כשליש בלבד מארון שרתים סטנדרטי במרכז נתונים, וכוללת שבב יחיד עצום בעל כ־850,000 ליבות עיבוד וכ־2.6 טריליון טרנזיסטורים. המערכת תוכננה להתמודד עם מודלי בינה מלאכותית בקנה מידה חסר תקדים, ומסוגלת לתמוך במודלים המכילים יותר מ־120 טריליון פרמטרים על גבי מערכת אחת.[9][10]
הדור השני של ה־WSE הרחיב משמעותית גם את יכולות הזיכרון והתקשורת הפנימית של השבב: נפח זיכרון ה־SRAM המובנה גדל ל־40 גיגה־בייט, רוחב הפס של הזיכרון הגיע ל־20 פטה־בייט לשנייה, ורוחב הפס הכולל של רשת התקשורת הפנימית הגיע ל־220 פטה־ביט לשנייה. נתונים אלו נועדו לאפשר העברת מידע מהירה במיוחד בתוך השבב, תוך צמצום צווארי בקבוק והשהיות.[11]
ביוני 2022 קבעה החברה שיא בתחום הבינה המלאכותית, כאשר מערכת CS-2 יחידה הצליחה לאמן מודלי AI עצומים בעלי עד 20 מיליארד פרמטרים על גבי שבב יחיד. מדובר באחד המודלים הגדולים ביותר שאומנו באותה תקופה על מערכת אחת בלבד.[12][13] המערכת תוכננה במיוחד עבור מודלי עיבוד שפה טבעית (NLP), והצליחה להריץ מודלים מתקדמים כמו GPT-NeoX ו־GPT-3 ביעילות גבוהה, תוך צמצום משמעותי של המורכבות התשתיתית הנדרשת בדרך כלל לאימון מודלים בקנה מידה כזה.
בספטמבר 2022 הכריזה סרבראס כי פיתחה אפשרות לחבר מספר שבבי Wafer-Scale יחד ליצירת אחד מאשכולות המחשוב הגדולים ביותר שנבנו עבור בינה מלאכותית.[14]המערכת, המכונה Wafer-Scale Cluster, מסוגלת לחבר עד 192 מערכות CS-2 למערך מחשוב אחד. אפילו אשכול קטן יותר של 16 מערכות CS-2 מסוגל ליצור מערכת הכוללת כ־13.6 מיליון ליבות עיבוד עבור יישומי עיבוד שפה טבעית. המערכת עושה שימוש בשיטת אימון שבה מספר מערכות מעבדות במקביל חלקים שונים של נתוני האימון, ובכך מאיצות משמעותית את תהליך האימון של מודלי בינה מלאכותית גדולים.[15]
בנובמבר 2022 חשפה סרבראס את מחשב־העל Andromeda, המשלב 16 שבבי WSE-2 במערך מחשוב אחד הכולל כ־13.5 מיליון ליבות עיבוד המותאמות לבינה מלאכותית. המערכת מסוגלת להגיע לביצועים של עד אקסה-פלופס אחד של חישובי AI, כלומר יותר מקווינטיליון אחד (10¹⁸) פעולות חישוב בשנייה. בכך הפכה Andromeda לאחת ממערכות הבינה המלאכותית החזקות בעולם באותה תקופה.[16] למרות עוצמת החישוב האדירה שלה, צריכת החשמל הכוללת של המערכת עומדת על כ־500 קילו־ואט בלבד, נתון שנחשב נמוך משמעותית ביחס למחשבי־על מבוססי GPU בעלי ביצועים דומים.[16]
באוגוסט 2023 חברת סרבראס, אוניברסיטת מוחמד בן זאיד לבינה מלאכותית, וחברת G42, השיקו את Jais, מודל שפה גדול.[17]
במרץ 2024 הציגה החברה את ארכיטקטורת Wafer Scale Engine 3 (WSE-3), הדור השלישי של השבב שלה, המבוסס על תהליך ייצור של 5 ננומטר. השבב החדש כולל כ־4 טריליון טרנזיסטורים וכ־900,000 ליבות עיבוד המותאמות לבינה מלאכותית, ומשמש כבסיס למערכת ה־CS-3. בהשוואה לדור הקודם, ה־CS-3 מספקת פי שניים ביצועים, תוך המשך פיתוח הגישה של סרבראס למחשוב AI בקנה מידה עצום באמצעות שבב יחיד גדול במיוחד.
במאי 2024 סרבראס בשיתוף פעולה עם חוקרים מהמעבדות הלאומיות סנדיה, המעבדה הלאומית לורנס ליברמור, המעבדה הלאומית לוס אלמוס והמינהל לביטחון לאומי גרעיני, ביצעה סימולציה של כ־800,000 אטומים המקיימים אינטראקציה זה עם זה. המערכת חישבה את תנועת ואינטראקציות האטומים בקפיצות זמן זעירות של פמטו־שנייה אחת בכל פעם, יחידת זמן השווה לאלפית המיליארדית של מיליונית השנייה. כל שלב בחישוב ארך מיקרו־שניות בודדות בלבד על גבי שבב ה־WSE-2, מהירות גבוהה משמעותית מזו שהושגה במחשב־העל פרונטיר.[18]
ביוני 2024 הכריזה על שיתוף פעולה עם חברת דל עבור תשתית מחשוב מבוססת בינה מלאכותית עבור בינה מלאכותית יוצרת.[19]
באוגוסט באותה שנה השיקה החברה שירות להרצת מודלי בינה מלאכותית (AI Inference Service), שלטענתה היה מהיר פי 10 עד פי 20 ממערכות המבוססות על מעבדי ה־H100 הופר של אנבידיה.[20]
בפברואר 2025 חברת Mistral AI החלה להשתמש במוצרי סרבראס כדי להפעיל את שירות Le Chat שלה ושברה שיאי מהירות.[21] בנוסף הכריזה על שותפות עם Perplexity על מנת לשפר את המהירות במנועי חיפוש מבוססי בינה מלאכותית.[22] באפריל 2025 הודיעה על עסקה עם DARPA.[23]
במאי 2025 עקפה סרבראס את פלטפורמת Blackwell של אנבידיה בביצועי הרצת מודלי בינה מלאכותית. בבדיקות שביצעה חברת מדידה עצמאית, הצליחה מערכת של סרבראס להגיע לקצב של יותר מ־2,500 יחידות טקסט בשנייה לכל משתמש, לעומת כ־1,000 בלבד במערכת של אנבידיה, בעת הרצת מודל השפה Llama 4 Maverick בעל 400 מיליארד פרמטרים של מטא.[24]
בינואר 2026 חתמה סרבראס על הסכם עם OpenAI לאספקת 750 מגה-וואט של כוח מחשוב עד 2028 תמורת 10 מיליארד דולר.[25] כחלק מההסכם עם OpenAI, נאסר על החברה באופן זמני למכור את מוצריה לחברת אנת'רופיק.[5]
במרץ 2026 חתמה Amazon Web Services על הסכם לרכישת מערכות CS-3 של סרבראס. המערכות נועדו להשתלב בשרתי הבינה המלאכותית מבוססי Trainium של AWS, אשר עתידים להיפרס במרכזי הנתונים של שירות Amazon Bedrock.[26]
קישורים חיצוניים
אתר האינטרנט הרשמי של סרבראס מערכות
סרבראס מערכות, ברשת החברתית אקס (טוויטר)
סרבראס מערכות, חברה ברשת החברתית LinkedIn- אסף גלעד, הסמנכ"ל מאינטל והקיבוצניק מעמק הירדן: הישראלים מאחורי הנפקת הענק בוול סטריט, באתר גלובס, 15 במאי 2026
- מידע עסקי על חברת סרבראס מערכות באתרים Yahoo! Finance • MarketWatch • CNN Money • Bloomberg Business (באנגלית)
- סרבראס מערכות, בגוגל פיננסים
הערות שוליים
- ↑ Wang, Echo (13 במאי 2026). "Cerebras prices IPO at $185 per share to raise $5.55 billion". Reuters.
{{cite news}}: (עזרה) - ↑ Tilley, Aaron (31 באוגוסט 2017). "AI Chip Boom: This Stealthy AI Hardware Startup Is Worth Almost A Billion". Forbes.
{{cite news}}: (עזרה) - ↑ Haddad, CJ (14 במאי 2026). "Cerebras IPO mints two billionaires, sets stage for potential AI wave". CNBC.
{{cite news}}: (עזרה) - ↑ Bort, Julie (14 במאי 2026). "Cerebras IPO makes billions for Benchmark but VC Eric Vishria almost didn't take the meeting". TechCrunch.
{{cite news}}: (עזרה) - ^ 5.0 5.1 5.2 Bort, Julie (16 במאי 2026). "$60B AI chip darling Cerebras almost died early on, burning $8M a month". TechCrunch.
{{cite news}}: (עזרה) - ^ 6.0 6.1 Crichton, Danny (19 בנובמבר 2019). "The Cerebras CS-1 computes deep learning AI problems by being bigger, bigger, and bigger than any other chip". TechCrunch.
{{cite news}}: (עזרה) - ↑ Takahashi, Dean (2019-11-19). "Cerebras Systems deploys the 'world's fastest AI computer' at Argonne National Lab". VentureBeat.
- ↑ Moore, Samuel K. (1 בינואר 2020). "Cerebras's Giant Chip Will Smash Deep Learning's Speed Barrier". IEEE Spectrum.
{{cite news}}: (עזרה) - ↑ Takahashi, Dean (2021-04-20). "Cerebras launches new AI supercomputing processor with 2.6 trillion transistors". VentureBeat.
- ↑ Ray, Tiernan (20 באפריל 2021). "Cerebras continues 'absolute domination' of high-end compute, it says, with world's hugest chip two-dot-oh". ZDNet.
{{cite news}}: (עזרה) - ↑ Khalili, Joel (2021-08-25). "The world's largest chip is creating AI networks larger than the human brain". TechRadar.
- ↑ Pires, Francisco (2022-06-22). "Cerebras Slays GPUs, Breaks Record for Largest AI Models Trained on a Single Device". Tom's Hardware.
- ↑ Takahashi, Dean (2022-06-22). "Cerebras Systems sets record for largest AI models ever trained on one device". VentureBeat.
- ↑ Shah, Agam (2022-09-14). "Cerebras Proposes AI Megacluster with Billions of AI Compute Cores". HPCwire.
- ↑ Freund, Karl (2022-09-14). "New Cerebras Wafer-Scale Cluster Eliminates Months Of Painstaking Work To Build Massive Intelligence". Forbes.
- ^ 16.0 16.1 Alcorn, Paul (2022-11-14). "Cerebras Reveals Andromeda, a 13.5 Million Core AI Supercomputer". Tom's Hardware.
- ↑ Cherney, Max A. (2023-08-30). "UAE's G42 launches open source Arabic language AI model". Reuters.
- ↑ Genkina, Dina (12 ביוני 2024). "Giant Chips Give Supercomputers a Run for Their Money". IEEE Spectrum.
{{cite news}}: (עזרה) - ↑ Chang, Ollie (20 ביוני 2024). "Cerebras partners with Dell to challenge Nvidia's AI dominance". DigiTimes.
{{cite news}}: (עזרה) - ↑ Ray, Tiernan (27 באוגוסט 2024). "AI startup Cerebras debuts 'world's fastest inference' service – with a twist". ZDNET.
{{cite news}}: (עזרה) - ↑ Nellis, Stephen (6 בפברואר 2025). "AI chip firm Cerebras partners with France's Mistral, claims speed record". Reuters.
{{cite news}}: (עזרה) - ↑ Nuñez, Michael (2025-02-11). "Cerebras-Perplexity deal targets $100B search market with ultra-fast AI". VentureBeat.
- ↑ Trueman, Charlotte (2025-04-02). "Cerebras and Ranovus receive $45m DARPA contract to "solve" compute bottleneck". Data Center Dynamics.
- ↑ "Cerebras Beats NVIDIA Blackwell in Llama 4 Maverick Inference" (Press release). Business Wire. 28 במאי 2025.
{{cite press release}}: (עזרה) - ↑ Rooney, Jordan; Novet, Kate (2026-01-14). "Cerebras scores OpenAI deal worth over $10 billion ahead of AI chipmaker's IPO". CNBC.
- ↑ Trueman, Charlotte (13 במרץ 2026). "AWS partners with big chip co. Cerebras for AI "inference disaggregation"". Data Center Dynamics.
{{cite news}}: (עזרה)
סרבראס מערכות43267742Q66604886