2024-10-11

2 H100s: כיצד התפוצצה בועת השכרת ה-GPU

השוק של יחידות עיבוד גרפיות (GPU) חווה ירידת מחירים משמעותית, כאשר מחירי ה-H100 ירדו מ-8 דולר לשעה לפחות מ-2 דולר לשעה בשל עודף היצע ושינויים בדינמיקת הביקוש. גורמים התורמים לשינוי זה כוללים מכירת חישוב שמור, כוונון עדין של מודלים פתוחים, והפחתה במספר חברות המודל הבסיסי החדשות, מה שהופך את השכרת ה-GPU למשתלמת יותר מרכישה. הופעתם של מודלים במשקל פתוח ואלטרנטיבות זולות יותר, כמו GPU של AMD ואינטל, משפיעה על השוק, עם דגש גובר על הסקת מסקנות בינה מלאכותית וכוונון עדין, בתמיכה של פלטפורמות כמו Featherless.AI המציעות פתרונות בינה מלאכותית חסכוניים.

תגובות

השוק להשכרת GPU חווה ירידת מחירים דרמטית עבור GPUs מדגם H100, מ-8 דולר לשעה ל-2 דולר לשעה, בשל היצע יתר וירידה בביקוש מצד חברות מודלים בסיסיים חדשות.
ירידת המחירים הזו פוצצה את בועת השכרת ה-GPU, והשפיעה על משקיעים שהשקיעו רבות בתשתית GPU.
המאמר בוחן את הפוטנציאל לנוף בינה מלאכותית נגיש יותר עם אפשרויות חישוב זולות יותר, אם כי הקיימות לטווח הארוך של מחירים נמוכים אלה ועתיד תשתיות הבינה המלאכותית אינם ודאיים.

טסלה רובוטקסי

תגובות

לאחרונה הציגה טסלה את הרובוטקסי שלה, תוך הדגשת חזון למוניות אוטונומיות השונה מהגישה של וויימו, המשתמשת בחומרה יקרה כמו LiDAR. העיצוב של הרובוטקסי, החסר הגה, מצביע על עתיד התלוי באוטונומיה מלאה, אם כי הוא מתמודד עם אתגרים רגולטוריים וטכנולוגיים. הטכנולוגיה של טסלה לנהיגה עצמית מלאה (FSD) היא נושא לדיון, כאשר מבקרים מטילים ספק במוכנותה לנהיגה ללא פיקוח ותומכים אופטימיים לגבי הפוטנציאל שלה.

להתחיל להשבית תוספים מותקנים שעדיין משתמשים ב-Manifest V2 בכרום היציב

Google מפסיקה את השימוש ב-Manifest V2 עבור תוספי Chrome, עם אזהרות והשבתה של תוספים אלה החל מערוצים לפני יציבות החל מה-9 באוקטובר 2024.
משתמשים מעודדים לעבור לאלטרנטיבות של Manifest V3, כאשר לעסקים יש עד יוני 2025 להשלים את המעבר באמצעות מדיניות ExtensionManifestV2Availability.
התהליך של הפסקת השימוש החל ב-3 ביוני 2024, וחנות האינטרנט של כרום לא קיבלה תוספים חדשים של Manifest V2 מאז יוני 2022 עבור תוספים פרטיים ומינואר 2022 עבור תוספים ציבוריים או לא רשומים.

תגובות

כרום עובר מהרחבות Manifest V2 להרחבות Manifest V3, מה שמשפיע על חוסמי פרסומות כמו uBlock Origin על ידי הגבלת יכולותיהם. בעוד כרום מבצע את המעבר הזה, דפדפנים כמו פיירפוקס, ויואלדי וברייב מתכוונים להמשיך לתמוך ב-Manifest V2 לעת עתה. שינוי זה עורר דיונים על שליטה ופרטיות של משתמשים, כאשר חלק מהמשתמשים שוקלים לעבור לדפדפנים חלופיים כדי לשמור על תכונות חסימת פרסומות יעילות.

ליספ קומפיילר ל-RISC-V שנכתב בליספ

“uLisp היא גרסה של שפת התכנות Lisp המיועדת למיקרו-בקרים, ותומכת בפלטפורמות כמו Arduino, Raspberry Pi ו-ESP32. היא כוללת תכונות כמו ניפוי שגיאות, ממשק כרטיס SD וממשקי סדרתי I2C/SPI, עם דוגמאות ליישומים כמו הבהוב LED ורישום נתונים. תכונה משמעותית היא המהדר של Lisp עבור RISC-V, שמדרג פונקציות Lisp לקוד מכונה, תומך בפונקציות רקורסיביות ואופטימיזציה של קריאות זנב לשיפור הביצועים.”

תגובות

ליבת קומפילר ליספ עבור RISC-V, שנכתבת בליספ, נמצאת בפיתוח אך חסרה פעולות ופונקציות מסוימות כדי להיות מסוגלת להידור עצמי. הקומפילר תומך בפונקציות ליספ בסיסיות כמו car ו-cdr, אך הוא עדיין לא שלם. uLisp מודגשת בשל פשטותה והתאמתה למיקרו-בקרים, כאשר RISC-V מהווה פלטפורמה אטרקטיבית לחובבי טכנולוגיה והאקרים.

פרס נובל לשלום לשנת 2024 הוענק לארגון ניהון הידנקיו

הפרס נובל לשלום לשנת 2024 הוענק לארגון היפני ניהון הידנקיו, המורכב מניצולי פצצות אטום, הידועים כהיבקושה, על פעילותם למען עולם ללא נשק גרעיני. ההיבקושה תרמו באופן משמעותי להקמת ה"טאבו הגרעיני", נורמה עולמית נגד השימוש בנשק גרעיני, באמצעות עדויותיהם המשפיעות. הכרה זו מתיישבת עם חזונו של אלפרד נובל לכבד מאמצים המועילים לאנושות וממשיכה להוות השראה לדורות חדשים לקראת פירוק נשק גרעיני.

תגובות

הפרס נובל לשלום לשנת 2024 הוענק לארגון היפני ניהון הידנקיו, הפועל נגד נשק גרעיני, ומדגיש את האיום המתמשך של נשק גרעיני על רקע מתחים גלובליים. הפרס משמש כתזכורת להשפעה ההרסנית של מלחמה גרעינית, כפי שהודגם בהירושימה ונגסאקי, ומדגיש את חשיבות הפירוק מנשק. הדיון בפרס כולל גם את המורכבויות של הרתעה גרעינית, החוק הבינלאומי והדינמיקה הגיאופוליטית בין מעצמות גרעיניות.

חלופות ל-WordPress

המאמר עודכן לכלול יותר חלופות למערכות ניהול תוכן (CMS) בשל עניין גובר, במיוחד לאור המצב הנוכחי של וורדפרס. הרשימה כוללת אפשרויות CMS להורדה כמו Ghost, Kirby, Indiekit, Craft CMS, ClassicPress, Statamic, Wagtail ו-Textpattern, תוך אי הכללת CMS מבוססי API ו-git. אזכורים בולטים כוללים את Ghost בזכות תכונות הדוא"ל המובנות שלה, Kirby בשל הגישה מבוססת הקבצים שלה, ו-ClassicPress כפורק של וורדפרס המובל על ידי הקהילה, בעוד ש-CMS מסוימות כמו Anchor אינן מתוחזקות עוד.

תגובות

Jekyll ב-GitHub Pages מומלץ לבלוגים פשוטים המשתמשים ב-Markdown, ומציע קלות שימוש ללא צורך בהתקנה מקומית ומאפשר ניידות תוכן בין פלטפורמות.
חלופות ל-WordPress לבלוגים כוללות את Chyrp Lite, Typecho, Quartz, ו-Logseq, בעוד ש-Drupal, ProcessWire, ו-Wagtail מספקות יותר גמישות למפתחים.
מחוללי אתרים סטטיים כמו Astro ו-Publii הופכים לפופולריים יותר ויותר, ולצורך אחסון תמונות, מוצעות אפשרויות כמו S3+Cloudfront או CloudFlare.

Google Play הרגה את המשחק שלי ולא תספר לי למה

טוקון, מפתח משחקים עצמאי, עבד על "Anti-Idle: Reborn", שאושר על ידי גוגל ואפל, והיה בבטא סגורה במשך חודש. ב-7 באוקטובר 2024, גוגל סיימה את חשבונו של טוקון בטענה ל"הפרות קודמות" ו"סיכון גבוה", אך לא סיפקה הסבר ברור, מה שהשפיע על עבודתו והכנסתו. מצב זה מדגיש בעיה רחבה יותר שבה מפתחים חווים סיומי חשבון מעורפלים, מה שמעורר קריאות לשקיפות ובהירות רבה יותר מפלטפורמות כמו גוגל.

תגובות

Google Play הסירה את המשחק של מפתח ללא הסבר, מה שמדגיש את השליטה המשמעותית שיש לחברות טכנולוגיה על מפתחים.
נרשמו מקרים דומים עם אמזון וגוגל, שבהם חשבונות או אפליקציות נאסרו ללא סיבות ברורות או תמיכה מספקת.
מעודדים מפתחים לגוון את הפלטפורמות שלהם כדי להפחית סיכונים, שכן מצב זה מדגיש חששות רחבים יותר לגבי שירות הלקוחות של ענקיות הטכנולוגיה והסיכונים התלויים בבניית עסקים על הפלטפורמות שלהן.

סיירת נורדל

תגובות

בשנת 2023, 221 מכולות נשלחו לאיבוד בים, מספר קטן יחסית ל-250 מיליון מכולות שנשלחות מדי שנה, מה שמדגיש את היקף הפעילות של תעשיית השילוח העולמית.
גרגירי פלסטיק, הידועים כנורדלים, הם מזהמים נראים לעין על חופים ויכולים להתפרק למיקרופלסטיק, להיכנס לשרשרת המזון ולגרום לנזק פוטנציאלי, אם כי הם אינם המקור העיקרי לזיהום פלסטיק ימי.
הדיון על זיהום פלסטיק מדגיש את מורכבותו והשפעתו הגלובלית, כולל ייצוא בעיות פסולת ממדינות מפותחות למדינות מתפתחות וההתאמה הפוטנציאלית של מערכות אקולוגיות לזיהום פלסטיק, מה שמעלה חששות לגבי השימוש העתידי בפלסטיק.

לקחים ראשוניים על ביצועי CUDA

מאלטה סקרופקה מדבר על חווייתו בלימוד CUDA, ומציין שזה בעצם C++ עם תכונות נוספות לחישוב מקבילי.
לקחים מרכזיים לאופטימיזציה של ביצועי CUDA כוללים קואולסינג של זיכרון, הבנה של סוגי זיכרון שונים, ומקסום הפרלליזם על ידי שימוש במספר רב של תהליכונים והפרדת משימות לגרעינים שונים.
סקארופקה מדגיש כי כתיבת CUDA דומה לפתרון פאזל, כאשר המיקוד העיקרי צריך להיות על הרצת משימות במקביל לפני אופטימיזציה למהירות.

תגובות

הדיון מתמקד באופטימיזציה של קוד CUDA לביצועי GPU, במיוחד עבור טריגר בניסוי LHC (מאיץ החלקיקים הגדול), על ידי ניהול רשומות, זיכרון משותף ובלוקי תהליכונים.
זה מדגיש את הפשרות בין תפוסה (מספר התהליכים הפעילים), שימוש ברגיסטרים ועיכובי זיכרון, תוך הדגשת ההתפתחות של מגבלות התכנות ב-CUDA.
השיחה משווה בין ביצועי GPU ו-CPU, מציינת הבדלים בצריכת החשמל וביכולות החישוב, ומדגישה את החשיבות של איזון בין תפוסה לביצועים עבור התקדמות עתידית בחומרה ובתוכנה.

ה-FBI יצר מטבע כדי לחקור תוכניות פאמפ-אנד-דאמפ בקריפטו

ה-FBI פיתח מטבע קריפטו מבוסס את'ריום בשם NexFundAI כדי לחקור ולחשוף תוכניות פאמפ-אנד-דאמפ בקריפטו, מה שהוביל לפעולות משפטיות משמעותיות. הוגשו כתבי אישום נגד 18 אנשים וישויות בגין הונאה ומניפולציה בשוק, כאשר הרשות לניירות ערך מתמקדת בשלושה יוצרי שוק ותשעה אחרים על ניפוח מחירי נכסי קריפטו. משרד המשפטים הצליח להחזיר 25 מיליון דולר מהכנסות הונאה, אשר יוחזרו למשקיעים, מה שמדגיש את היעילות של המבצע במאבק בהונאות קריפטו.

תגובות

ה-FBI פיתח מטבע קריפטוגרפי כדי לחקור תוכניות 'פאמפ אנד דאמפ', שהן פרקטיקות הונאה שמנפחות באופן מלאכותי את מחיר הנכס לפני שמוכרים אותו.
יוזמה זו הציתה ויכוחים על לכידה וההשלכות האתיות של אכיפת החוק ביצירת ניירות ערך מזויפים.
הדיון מתרחב לחששות רחבים יותר לגבי הלגיטימיות של מטבעות קריפטוגרפיים ותפקיד הממשלה בוויסות מטבעות דיגיטליים.

NotesHub: אפליקציה לרישום הערות מבוססת Markdown, חוצת פלטפורמות

האפליקציה זמינה במספר פלטפורמות, כולל iOS, Android, Windows, Mac, Apple Vision Pro והאינטרנט, כאשר הגרסה האינטרנטית היא אפליקציית רשת מתקדמת חינמית שעובדת במצב לא מקוון. ניתן לאחסן הערות במאגרים של Git, עם האינטגרציה הטובה ביותר עם GitHub, ותמיכה גם באפשרויות אירוח עצמי כמו Gitea, מערכות קבצים או iCloud Drive. האפליקציה תומכת בתחביר Markdown עשיר עם הרחבות ליצירת לוחות קנבן, לוחות לבנים מבוססי Excalidraw, וכוללת תכונות כמו Mermaid ו-ABC לתיווי מוזיקלי.

תגובות

NotesHub הוא אפליקציה רב-תכליתית לכתיבת הערות המבוססת על Markdown, זמינה במגוון פלטפורמות, כולל iOS, Android, Windows, Mac, Apple Vision Pro והאינטרנט. האפליקציה מציעה גרסת Progressive Web App חינמית, בעוד שהגרסאות המקומיות דורשות תשלום חד-פעמי, עם אינטגרציה חזקה לאחסון הערות במאגרי Git כמו GitHub, GitLab או Bitbucket. היא כוללת תחביר Markdown עשיר, לוחות Kanban ולוחות לבנים מבוססי Excalidraw, כאשר משתמשים משבחים את העיצוב הנקי ואת היכולות הלא מקוונות שלה, אם כי היא אינה קוד פתוח ויש לה תמיכה מוגבלת בלינוקס.

מתג איש מת ללא תלות בתשתית שלך

פרויקט Go חדש בשם Deadcheck פותח כדי לשמש כמתג איש מת ללא תלות בעבודות cron, טיימרים או מסדי נתונים. Deadcheck משתלב עם PagerDuty, פלטפורמת ניהול תקריות פופולרית, כדי לשמור על תקריות במצב השהיה עד שמפספסים צ'ק-אין, ואז הוא מפעיל התראה. פרויקט זה בולט בגישתו החדשנית לניהול התראות ותקריות ללא תלות בתזמון מסורתי או במסדי נתונים.

תגובות

Deadcheck הוא פרויקט ב-Go שנועד לשמש כמתג איש מת, המבטל את הצורך בעבודות cron או במסדי נתונים, ומשתלב עם PagerDuty לניהול התראות.
הפרויקט עורר דיונים על מתגי איש מת, כולל היבטים משפטיים ופתרונות חלופיים כמו שימוש בעורכי דין או מערכות בלוקצ'יין.
משתמשים הציעו שירותים קיימים כמו Cronitor או OpsGenie עבור פונקציות דומות, והפרויקט מתכנן להרחיב את האינטגרציות מעבר ל-PagerDuty.

להבין את המגבלות של חשיבה מתמטית במודלים של שפה גדולה

המאמר "GSM-Symbolic" מאת אימן מירזאדה ואחרים חוקר את יכולות ההיגיון המתמטי של מודלים לשוניים גדולים (LLMs) באמצעות מדד ה-GSM8K. המחברים מציגים את GSM-Symbolic, מדד חדש עם תבניות סימבוליות, המראה כי LLMs מתקשים עם שינויים בערכים מספריים ותוספות של סעיפים בשאלות. המחקר מציע כי ייתכן ש-LLMs משחזרים היגיון מנתוני האימון במקום לבצע היגיון לוגי אמיתי, מה שמדגיש את המגבלות שלהם בהיגיון מתמטי.

תגובות

מודלים לשוניים גדולים (LLMs) מתמודדים עם אתגרים בהיגיון מתמטי, במיוחד כאשר בעיות כוללות מידע לא רלוונטי, מה שמשפיע על הביצועים שלהם. מגבלה זו מדגישה את ההסתמכות של LLMs על זיהוי תבניות על פני היגיון לוגי, מה שהופך אותם לפחות יעילים בתרחישים בעולם האמיתי עם פרטים מיותרים. למרות ההתקדמות, LLMs עדיין מתקשים להבחין בין מידע חשוב לרעש, מיומנות קריטית הנדרשת ליישומים מעשיים.

אריה: מודל מומחים מעורב מולטימודלי פתוח

אריה הוא מודל AI מולטימודלי פתוח שמשלב מידע מגוון מהעולם האמיתי להבנה מקיפה, ועולה בביצועים על מודלים כמו Pixtral-12B ו-Llama3.2-11B. זהו מודל תערובת-מומחים עם 3.9 מיליארד ו-3.5 מיליארד פרמטרים מופעלים לכל טוקן חזותי וטקסטואלי, בהתאמה, מה שמשפר את יכולות השפה והמולטימודלי שלו. המשקלים וקוד הבסיס של המודל הם בקוד פתוח, מה שמקל על אימוץ והתאמה על ידי מפתחים וחוקרים.

תגובות

אריה הוא מודל חדש רב-מודלי מסוג תערובת מומחים (MoE) שמצליח יותר מ-Pixtral-12B ו-Llama3.2-11B בביצועים ובמהירות חיזוי על ידי ניצול יעיל של פרמטרים פעילים. למרות שיש לו שימוש בזיכרון דומה למודל של 25B, אריה מתפקד כמו מודל של 10B ופועל במהירות של מודל של 4B, מה שהופך אותו מתאים למכשירים עם זיכרון מספיק, כמו M2 Max. המומחים של המודל מתמקדים בתחביר, עם מקום לשיפור בבחירת המומחים, והוא זמין כעת לבדיקה, אם כי חלק מהמשתמשים נתקלו בבעיות בפלטפורמה.