חשד לגניבת נתונים על ידי הסטארטאפ הסיני DeepSeek

מיקרוסופט ו-OpenAI בודקות האם קבוצת אנשים המקושרת ל-DeepSeek השיגה באופן לא מורשה נתונים מ-OpenAI

 

 
חשד לגניבת נתונים על ידי הסטארטאפ הסיני DeepSeek / תמונה: Dreamstimeחשד לגניבת נתונים על ידי הסטארטאפ הסיני DeepSeek / תמונה: Dreamstime
 

עמית י.
LinkedinFacebookTwitter Whatsapp
30/01/2025

בזמן שההצלחה של DeepSeek עדיין מכה גלים בשווקים וההשפעה שלה על המשקיעים עדיין ניכרת ומעלה דיונים רבים לגבי שאלת הדומיננטיות של ארצות הברית, העלויות וההוצאות הגבוהות של חברות הטכנולוגיה מול התוצאות הנמוכות, ברקע נבדקת אפשרות של גניבת נתונים.

חברת מיקרוסופט ו OpenAI בודקות האם פלט נתונים מהטכנולוגיה של OpenAI הושגה באופן לא מורשה על ידי קבוצה המקושרת לסטארטאפ הסיני הבינה המלאכותית DeepSeek, הכל כך מדוברת השבוע, זאת לפי אנשים שמכירים את הנושא. כזכור, DeepSeek פרסמה מוקדם יותר החודש מודל חדש של בינה מלאכותית בקוד פתוח בשם R1 שיכול לחקות את הדרך בה בני אדם חושבים, ולשבש את השוק שנשלט על ידי מתחרות בארצות הברית כמו ו Open A, גוגל ומטא. והיא עשתה זאת בעלויות נמוכות שהשאירו את עולם ההשקעות עם פה פעור.

האיום הפוטנציאלי על יתרון החברות בארה"ב בתעשייה גרם למניות טכנולוגיה הקשורות לבינה מלאכותית לאבד גובה ביום שני, הן באסיה והן לאחר מכן בארה"ב - כולל את מיקרוסופט, אנבידיה, אורקל, ברודקום ועוד, ולמחוק סך של טריליון דולר, אם כי בינתיים הן גם החלו לתקן.

 


מניית אנבידיה גרף יומי 
 

בינתיים, מתברר שחוקרי האבטחה של מיקרוסופט כבר לפני מספר חודשים הבחינו בגורמים שלדעתם עשויים להיות קשורים ל-,DeepSeek  מחלצים כמות גדולה של נתונים באמצעות ממשק תכנות היישומים של OpenAI או באמצעות API – כך אמרו גורמים מסוימים שביקשו שזהותם לא תיחשף מכיוון שהעניין עדיין חסוי. למעשה, מפתחי תוכנה יכולים לשלם עבור רישיון להשתמש ב- API כדי לשלב את דגמי הבינה המלאכותית הקניינית של OpenAI באפליקציות שלהם, בדגש על 'לשלם'.

מיקרוסופט, שהיא שותפת טכנולוגיה של OpenAI והמשקיעה הגדולה ביותר שלה, פנתה ל-Open Ai והודיעה לה על הפעילות החשודה הזו. מדובר בפעילות שאם אכן התרחשה, עלולה להפר את תנאי השירות של OpenAI או עלולה להצביע על כך שהקבוצה פעלה כדי לעקוף את ההגבלות של OpenAI לגבי כמות הנתונים שהם יכולים להשיג. על פי הפרסומים, OpenAI עדיין לא סיפקה תגובה לפניה זו. כמו כן, מיקרוסופט סירבה להגיב בשלב זה בנושא. גם  DeepSeekלא הגיבה לפניות שנשלחו באמצעות הדוא"ל.

דייוויד סאקס, האחראי על נושא הבינה המלאכותית מטעם הנשיא טראמפ, אמר שלשום שיש ראיות משמעותיות לכך ש-  DeepSeek מתבססת על הפלט של המודלים של חברת OpenAI כדי להיעזר בה לצורך פיתוח טכנולוגיה משלה. הוא תיאר טכניקה שנקראת זיקוק לפיה מודל AI אחד משתמש בתפוקות של אחר לצורך מטרות אימון במטרה לפתח יכולות דומות. לדבריו, יש ראיות משמעותיות לכך שמה ש- DeepSeek עשו כאן הוא שהם זיקקו ידע ממודלים של OpenAI מיותר לציין שOpenAI  מאוד לא מרוצה מכך אם אכן יתברר שזה המקרה.  אך באותה נשימה  OpenAIאמרה בתגובה שקבוצות בסין אכן משתמשות באופן פעיל בשיטות, כולל מה שמכונה זיקוק, כדי לנסות לשכפל מודלים מתקדמים של בינה מלאכותית אמריקאית. כלומר, הם מודעים ובוחנים אינדיקציות לכך ש-DeepSeek  זיקקה את הדגמים שלה במרמה, אך אינה מוכנה לפרט בשלב זה יתר על המידה.

למעשה, במחקר שלה, DeepSeek כבר ציינה שהיא "זיקקה" מודלים ממערכת R1 שלה המבוססים על מערכות קוד פתוח אחרות מבלי לציין מי הן האחרות, ויש לציין שבניגוד למערכות הסגורות של OpenAI, קיימים דגמים מסוימים כגון Llama של מטאש הם בקוד פתוח וזמינים לשימוש חופשי.

עד שהדברים יתבררו, המשקיעים נשארים הן באפילה והן עם חששות. האסטרטגיה של DeepSeek  מגיעה עם גישת קוד פתוח, וזה משהו שפותח דלתות בפני חברות ושחקניות קטנות יותר שמתקשות לממן את העלויות הגבוהות הנדרשות לפיתוח בינה מלאכותית. זו מגמה שמאיימת על המונופול של חברות הטכנולוגיה הגדולות של ארצות הברית. למשל, מדינות מתעוררות אחרות כמו הודו עשויות להבין שהרבה יותר קל להסתגל למערכות האקולוגיות של סין. 

לסיום, יש לצין שלמרות שמודל הבינה המלאכותית של DeepSeek הפגין ביצועים בעלות נמוכה יותר, מתברר שהוא לא הכי מדוייק, ונכשל ב-83% מהמקרים. זה אחוז גבוה מאד ביחס לדגמים מערביים, כמו ChatGPT של OpenAI, ששיעור הכשל הממוצע שלהם הוא 62%. ולמרות הבעיות הללו, הפופולריות שלה בפלטפורמה של אפל מעלה שאלות לגבי ההשפעה הגוברת של סין במגזר הבינה המלאכותית והאם ארה"ב מפגרת בהובלה טכנולוגית. כנראה שימים יגידו.

אין בכתוב כל המלצה לביצוע פעולה כלשהי, כולל רכישה/קנייה/החזקה של סוגי ניירות הערך המופיעות בכתבה. ככלל, חובה על הקורא לעשות מחקר מעמיק בהתייחס לכל רעיון השקעה שהוא.

x