״המאמר מציג את "abliteration," טכניקה להסרת הצנזורה ממודלים של Llama ללא צורך באימון מחדש על ידי הסרת מנגנון הסירוב שלהם.״
אבליטרציה מזהה ומסירה את "כיוון הסירוב" בזרם השאריות של המודל, מה שמאפשר לו להגיב לכל הפקודות.
״הטכניקה יושמה על דגם Daredevil-8B, וכתוצאה מכך נוצר NeuralDaredevil-8B, מודל שפה גדול (LLM) ללא צנזורה עם ביצועים מעולים בקטגוריית 8B, אם כי נדרש אימון נוסף כדי לשחזר ירידות בביצועים.״
הטקסט דן בחוויית המשתמש עם מודל AI חדש שמספק תשובות ספקולטיביות במקום סירובים מוחלטים, מה שהמשתמש מוצא מרענן ומהנה.
הדיון מתמקד באתיקה ובאמצעי הבטיחות של מודלים של בינה מלאכותית, עם טיעונים בעד ונגד צנזורה, והאפשרות לשימוש לרעה במודלים לא מצונזרים לפעילויות מזיקות.
הטקסט מדגיש את האתגרים שבאיזון בין בטיחות בינה מלאכותית לחופש המידע, תוך הדגשת הצורך בהנחיות אתיות וההשלכות המשפטיות הפוטנציאליות של תוכן שנוצר על ידי בינה מלאכותית.
Meta מתמקדת במחקר בינה מלאכותית כדי להתמודד עם החישוב בקנה מידה גדול הנדרש לאימון מודלים גדולים של שפה (LLMs), מה שמחייב חשיבה מחדש על תוכנה, חומרה ותשתית רשת.
הם התאימו חומרה קיימת, כולל שינוי פלטפורמת גרנד טיטון עם מעבדי NVIDIA H100, ואופטימיזציה של פריסת מרכז הנתונים שלהם כדי למקסם את יכולת החישוב תוך שמירה על סביבה מקוררת באוויר.
״מטא בנתה שני אשכולות GPU של 24k באמצעות RoCE ו-InfiniBand כדי לאמן את Llama 3, תוך אופטימיזציה של תקשורת הרשת ואיזון העומס כדי להבטיח ביצועים גבוהים והעברת נתונים יעילה.״
מטא נאלצה להתאים את העיצובים המכניים והתרמיים שלה כדי להישאר בסביבה מקוררת באוויר בשל מגבלות זמן, מה שהוביל למחזור אימות לפריסה בקנה מידה גדול.
נותרות שאלות לגבי האופן שבו מטא אוספת ומכינה נתונים לאימון, במיוחד בנוגע למידע אישי מזהה (PII), שאינו נגיש כברירת מחדל ודורש גישה מיוחדת.
״הטקסט דן בתחרות בין חברות טכנולוגיה כמו גוגל, מיקרוסופט ומטה בפיתוח שבבים משלהן, תוך הדגשת הביצועים והיעילות הכלכלית של ה-GPUs של Nvidia לעומת ה-TPUs של גוגל.״
מדליף, אנדרו האריס, טוען שמיקרוסופט התעלמה מאזהרות לגבי פגם אבטחה קריטי כדי להימנע מאובדן עסקים עם הממשלה, פגם שנוצל מאוחר יותר על ידי האקרים רוסים במתקפת SolarWinds.
״האריס, מומחה לאבטחת סייבר, גילה פגיעות בתוכנית מבוססת הענן של מיקרוסופט שיכולה לאפשר גישה בלתי מזוהה למידע רגיש, אך אזהרותיו נדחו בשל השלכות פיננסיות פוטנציאליות.״
על אף מאמציו של האריס והפרות שבאו בעקבותיהם, מיקרוסופט טענה כי לא נעשה ניצול של אף מוצר או שירות, מה שהוביל לביקורת על העדפת החברה את הרווחים על פני אבטחת הלקוחות.
אנדרו האריס, חושף שחיתויות ומומחה אבטחת סייבר לשעבר במיקרוסופט, חשף כי מיקרוסופט עיכבה את הטיפול בפגם חמור בשירותי הפדרציה של Active Directory (AD FS) כדי להבטיח עסקה ממשלתית רווחית, מה שהוביל למתקפת הסייבר של SolarWinds.
חקירת ProPublica מדגישה תרבות בתוך מיקרוסופט שמעדיפה את צמיחת העסק על פני דאגות אבטחה מיידיות, ומשקפת בעיות רחבות יותר בתעשיית הטכנולוגיה של איזון בין רווח לאבטחת הלקוחות.
הטקסט דן באתגרים העומדים בפני חושפי שחיתויות ואנשי מקצוע בתחום הסייבר בקידום פעולה מהירה בנושאי אבטחה בתוך תאגידים המונעים על ידי רווח, תוך הדגשת הצורך בשינוי תרבותי להעדפת האבטחה.