כמה מים משתמשת בינה מלאכותית?

אני בטוח ששמעתם הכל, החל מ"בינה מלאכותית שותה בקבוק מים כל כמה שאלות" ועד "זה בעצם כמה טיפות". האמת מורכבת יותר. טביעת הרגל המים של בינה מלאכותית משתנה מאוד בהתאם למקום שבו היא פועלת, משך ההנחיה שלכם, ואיך מרכז נתונים מקרר את השרתים שלו. אז כן, המספר המרכזי קיים, אבל הוא חי בתוך סבך של אזהרות.

להלן אני מפרק מספרים ברורים ומוכנים לקבלת החלטה, מסביר מדוע ההערכות אינן מתאימות, ומראה כיצד קבלנים ומשתמשים יומיומיים יכולים לצמצם את עלות המים מבלי להפוך לנזירים של קיימות.

מאמרים שאולי תרצו לקרוא אחרי זה:

🔗 מהו מערך נתונים של בינה מלאכותית
מסביר כיצד מערכי נתונים מאפשרים אימון למידת מכונה ופיתוח מודלים.

🔗 כיצד בינה מלאכותית מנבאת מגמות
מראה כיצד בינה מלאכותית מנתחת דפוסים כדי לחזות שינויים ותוצאות עתידיות.

🔗 כיצד למדוד ביצועי בינה מלאכותית
מפרט מדדים חיוניים להערכת דיוק, מהירות ואמינות.

🔗 איך לדבר עם בינה מלאכותית
מנחה אסטרטגיות יעילות להנחיית תשובות לשיפור הבהירות, התוצאות והעקביות.

כמה מים משתמשת בינה מלאכותית? מספרים מהירים שבהם אפשר להשתמש בפועל 📏

לכל הנחיה, טווח טיפוסי כיום: מתת -מיליליטר עבור הנחיית טקסט חציונית במערכת מיינסטרים אחת, עד עשרות מיליליטר עבור תגובת חישוב ארוכה יותר באחרת. לדוגמה, חשבונאות הייצור של גוגל מדווחת על הנחיית טקסט חציונית של ~0.26 מ"ל (כולל תקורת הגשה מלאה) [1]. הערכת מחזור החיים של Mistral צובעת תגובת עוזר של 400 אסימונים ב-~45 מ"ל (הסקה שולית) [2]. ההקשר והמודל חשובים מאוד.
אימון מודל בקנה מידה חזיתי: יכול להגיע למיליוני ליטרים, בעיקר מקירור ומים המוטמעים בייצור חשמל. ניתוח אקדמי שצוטט באופן נרחב העריך כ-5.4 מיליון ליטרים לאימון מודל ברמת GPT, כולל כ-700,000 ליטרים הנצרכים באתר לקירור - וטען כי יש צורך בתזמון חכם כדי להפחית את עצימות המים [3].
מרכזי נתונים באופן כללי: אתרים גדולים צורכים מאות אלפי גלונים ביום אצל מפעילים גדולים, עם שיאים גבוהים יותר בקמפוסים מסוימים בהתאם לאקלים ולעיצוב [5].

בואו נהיה כנים: הנתונים האלה נראים לא עקביים בהתחלה. הם אכן כאלה. ויש לכך סיבות טובות.

מדדי צריכת מים מבוססי בינה מלאכותית ✅

תשובה טובה לשאלה כמה מים משתמשת בינה מלאכותית? צריכה לסמן כמה תיבות:

בהירות גבולות
האם זה כולל רק קירור באתר , או גם מחוץ לאתר המשמשים תחנות כוח לייצור חשמל? שיטות עבודה מומלצות מבחינה שאיבת מים בין לצריכת מים וטווחי 1-2-3, בדומה לחשבונאות פחמן [3].
רגישות למיקום:
מים לקוט"ש משתנה בהתאם לאזור ולתמהיל הרשת, כך שאותה פקודה יכולה לשאת השפעות מים שונות בהתאם למקום בו היא מוגשת - סיבה מרכזית לכך שהספרות ממליצה על תזמון מודע לזמן ולמקום [3].
ריאליזם של עומס העבודה
האם המספר משקף את הנחיות הייצור החציוניות, כולל קיבולת סרק ותקורה של מרכז הנתונים, או רק את המאיץ בשיא? גוגל מדגישה חשבונאות מערכת מלאה (סרק, מעבדים/DRAM ותקורה של מרכז הנתונים) לצורך הסקה, ולא רק את מתמטיקה של TPU [1].
טכנולוגיית קירור
קירור באידוי, קירור נוזלים בלולאה סגורה, קירור אוויר וגישות חדשות חיבור ישיר לשבב משנים את עוצמת המים באופן דרמטי. מיקרוסופט משיקה עיצובים שנועדו לבטל את השימוש במי קירור עבור אתרים מסוימים מהדור הבא [4].
שעת היום והעונה
חום, לחות ותנאי רשת החשמל משנים את יעילות ניצול המים בחיים האמיתיים; מחקר משפיע אחד מציע לתזמן עבודות עיקריות כאשר וכאשר עוצמת המים נמוכה יותר [3].

הסבר על צריכת מים לעומת צריכת מים 💡

משיכה = מים שנלקחים מנהרות, אגמים או אקוויפרים (חלקם מוחזרים).
צריכה = מים שלא מוחזרים משום שהם מתאדים או משולבים בתהליכים/מוצרים.

מגדלי קירור צורכים מים באמצעות אידוי. ייצור חשמל יכול לשאוב כמויות גדולות (ולפעמים לצרוך חלק מהן), בהתאם למפעל ולשיטת הקירור. מספר מים אמין של AI מדווח עליהם [3].

לאן הולכים המים בבינה מלאכותית: שלושת הדליים 🪣

היקף 1 - קירור באתר
החלק הנראה לעין: מים שמתאדים במרכז הנתונים עצמו. בחירות עיצוב כמו אידוי לעומת אוויר או נוזל בלולאה סגורה קובעות את קו הבסיס [5].
תחום 2 - ייצור חשמל.
כל קוט"ש יכול לשאת תג מים נסתר; התערובת והמיקום קובעים את אות הליטרים לקוט"ש שעומס העבודה שלך יורש [3].
היקף 3 - שרשרת אספקה
ייצור שבבים מסתמך על מים טהורים במיוחד בייצור. לא תראו זאת במדד "לפי הנחיה" אלא אם כן הגבול כולל במפורש השפעות מגולמות (למשל, LCA מלא) [2][3].

ספקים לפי מספרים, עם ניואנסים 🧮

גוגל ג'מיני מבקש
שיטת הגשה מלאה (כולל צריכת סרק ותקורה של המתקן). הטקסט החציוני מבקש כ-0.26 מ"ל מים לצד כ-0.24 וואט-שעה של אנרגיה; הנתונים משקפים את תנועת הייצור ואת הגבולות המקיפים [1].
מחזור חיים של Mistral Large 2.
LCA נדיר ועצמאי (עם ADEME/Carbone 4) מגלה כ-281,000 מ"ק לאימון + שימוש מוקדם וגבול הסקה של כ-45 מ"ל עבור של 400 אסימונים תשובת עוזר
שאיפתה של מיקרוסופט לקירור ללא צורך במים
מרכזי נתונים מהדור הבא מתוכננים לצרוך אפס מים לקירור, תוך הישענות על גישות של חיבור ישיר לשבב; שימושים אדמיניסטרטיביים עדיין דורשים מעט מים [4].
קנה מידה כללי של מרכזי נתונים
מפעילי נתונים גדולים מדווחים בפומבי על מאות אלפי גלונים ביום בממוצע באתרים בודדים; אקלים ועיצוב דוחפים את המספרים למעלה או למטה [5].
קו הבסיס האקדמי המוקדם יותר.
ניתוח "הבינה המלאכותית הצמאה" העריך מיליוני ליטרים לאימון מודלים ברמת GPT, וכי 10-50 תשובות בינוניות יכולות להיות שוות ערך של 500 מ"ל - תלוי במידה רבה מתי/היכן הן פועלות [3].

למה ההערכות כל כך שונות 🤷

גבולות שונים.
חלק מהנתונים כוללים רק קירור באתר; אחרים מוסיפים חשמל ומים; LCAs עשויים להוסיף ייצור שבבים. תפוחים, תפוזים וסלט פירות [2][3].
עומסי עבודה שונים
שורת טקסט קצרה אינה ריצת קוד/מודאל ארוכה; עיבוד קבוצות (batching), בו-זמניות (concurrency) והשהייה (latency) מכוונים לניצול שינויים [1][2].
אקלים ורשתות שונות
קירור אידוי באזור חם וצחיח ≠ קירור אוויר/נוזל באזור קריר ולח. עוצמת המים ברשת משתנה מאוד [3].
מתודולוגיות של ספקים:
גוגל פרסמה שיטת הגשה כלל-מערכתית; מיסטרל פרסמה LCA רשמי. אחרים מציעים הערכות נקודתיות עם שיטות דלילות. טענה מתוקשרת של "חמש עשרה כפית" לכל הנחיה הגיעה לכותרות - אך ללא פירוט גבולות, היא אינה ניתנת להשוואה [1][3].
מטרה נעה
תחום הקירור מתפתח במהירות. מיקרוסופט מבצעת פיילוט של קירור ללא מים באתרים מסוימים; פריסת שיטות אלו תפחית את צריכת המים באתר גם אם החשמל במעלה הזרם עדיין נושא אות מים [4].

מה אתם יכולים לעשות היום כדי להפחית את טביעת הרגל המים של בינה מלאכותית 🌱

גודל המודל הנכון
מודלים קטנים יותר, מכווני משימות, לרוב תואמים דיוק תוך צריכת פחות חישוב. ההערכה של מיסטרל מדגישה קורלציות חזקות בין גודל לשטח - ומפרסמת מספרי הסקה שוליים כדי שתוכלו להסיק לגבי פשרות [2].
בחרו אזורים בעלי מודעות למים.
העדיפו אזורים עם אקלים קריר יותר, קירור יעיל ורשתות עם עוצמת מים נמוכה יותר לקוט"ש; עבודת ה"בינה מלאכותית צמאה" מראה מודע לזמן ולמקום מסייע [3].
הזזת עומסי עבודה בזמן
תזמון אימון/הסקת קבוצות כבדות לשעות חסכוניות במים (לילות קרירים יותר, תנאי רשת נוחים) [3].
בקשו מהספק שלכם מדדים שקופים
של ביקוש למים לפי הנחיה, הגדרות גבולות, והאם המספרים כוללים קיבולת חוסר פעילות ותקורה של מתקן. קבוצות מדיניות דוחפות לחובה על גילוי נאות כדי לאפשר השוואות של תפוחים לתפוחים [3].
טכנולוגיית קירור חשובה.
אם אתם מפעילים חומרה, שקלו קירור בלולאה סגורה/ישירה לשבב; אם אתם בענן, העדיפו אזורים/ספקים שמשקיעים בעיצובים עמידים בפני מים [4][5].
שימוש במים אפורים ואפשרויות שימוש חוזר
קמפוסים רבים יכולים להחליף מקורות שאינם ראויים לשתייה או למחזר בתוך לולאות; מפעילים גדולים מתארים איזון בין מקורות מים ואפשרויות קירור כדי למזער את ההשפעה נטו [5].

דוגמה מהירה כדי להפוך את זה למציאות (לא כלל אוניברסלי): העברת עבודת הכשרה לילית מאזור חם ויבש באמצע הקיץ לאזור קריר ולח יותר באביב - והפעלתה בשעות שפל וקרירות יותר - יכולה לשנות הן באתר את צריכת המים מחוץ לאתר (ברשת). זהו סוג התזמון המעשי והדרמטי שיכול לשחרר [3].

טבלת השוואה: בחירות מהירות להורדת אגרת המים של בינה מלאכותית 🧰

כְּלִי	קהל	מְחִיר	למה זה עובד
דגמים קטנים יותר, מכווני משימות	צוותי למידה אלקטרונית, מובילי מוצר	נמוך-בינוני	פחות חישוב לכל אסימון = פחות קירור + חשמל ומים; הוכח בדיווח בסגנון LCA [2].
בחירת אזור לפי מים/קוט"ש	אדריכלי ענן, רכש	בֵּינוֹנִי	מעבר לאקלים קריר יותר ולרשתות עם עוצמת מים נמוכה יותר; שילוב עם ניתוב מודע לביקוש [3].
חלונות אימון בשעות היום	MLOps, מתזמנים	נָמוּך	לילות קרירים יותר + תנאי רשת טובים יותר מפחיתים את עוצמת המים האפקטיבית [3].
קירור ישיר לשבב/קירור בלולאה סגורה	תפעול מרכז נתונים	בינוני-גבוה	נמנע ממגדלי אידוי במידת האפשר, תוך צמצום הצריכה באתר [4].
בקרות אורך ובקרות אצווה	מפתחי אפליקציות	נָמוּך	הגבלת אסימוני בורח, אחסון קבוצות בצורה חכמה, אחסון תוצאות במטמון; פחות מילישניות, פחות מיליליטר [1][2].
רשימת בדיקה לשקיפות ספקים	מנהלי טכנולוגיות ראשיות, מובילי קיימות	לְשַׁחְרֵר	כופה בהירות גבולות (באתר לעומת מחוץ לאתר) ודיווח של תפוחים לתפוחים [3].
מים אפורים או מקורות ממוחזרים	מתקנים, עיריות	בֵּינוֹנִי	החלפת מים שאינם ראויים לשתייה מפחיתה את הלחץ על אספקת המים הראויה לשתייה [5].
שותפויות לשימוש חוזר בחום	מפעילים, מועצות מקומיות	בֵּינוֹנִי	יעילות תרמית טובה יותר מפחיתה בעקיפין את ביקוש הקירור ובונה מוניטין מקומי [5].

("המחיר" הוא רך מטבעו - פריסות משתנות.)

צלילה לעומק: קצב התופים של המדיניות מתחזק 🥁

גופי הנדסה קוראים לחובה לגילוי נתונים של אנרגיה ומים של מרכזי נתונים כדי שקונים וקהילות יוכלו לשפוט עלויות ותועלות. ההמלצות כוללות הגדרות היקף, דיווח ברמת האתר והנחיות מיקום - כי ללא מדדים דומים ומודעים למיקום, אנו מתווכחים בחושך [3].

צלילה מעמיקה: לא כולם מרכזי נתונים צורכים באותה צורה 🚰

ישנו מיתוס מתמשך ש"קירור אוויר אינו משתמש במים". לא בדיוק. מערכות כבדות אוויר דורשות לעתים קרובות יותר חשמל, אשר באזורים רבים נושא מים נסתרים מהרשת; לעומת זאת, קירור מים יכול לקצץ בצריכת החשמל והפליטות על חשבון המים באתר. מפעילים גדולים מאזנים במפורש את הפשרות הללו אתר אחר אתר [1][5].

צלילה מעמיקה: בדיקת מציאות מהירה על טענות ויראליות 🧪

ייתכן שראיתם הצהרות נועזות לפיהן הנחיה בודדת שווה ל"בקבוק מים", או, בצד השני, ל"רק כמה טיפות". יציבה טובה יותר: ענווה במתמטיקה. הנחיות הקריאה האמינות של היום הן כ-0.26 מ"ל עבור הנחיה חציונית לייצור עם תקורה מלאה של הגשה [1] וכ -45 מ"ל עבור תשובה של 400 אסימונים של עוזר (הסקה שולית) [2]. הטענה הנפוצה של "חמש עשרה כפית" חסרה גבול/שיטה ציבורית; התייחסו אליה כמו לתחזית מזג אוויר ללא העיר [1][3].

שאלות נפוצות קטנות: כמה מים משתמשת בינה מלאכותית? שוב, בעברית פשוטה 🗣️

אז מה עליי לומר בפגישה?
"לפי ההנחיה, זה נע בין טיפות לכמה לגימות, תלוי בדגם, באורך ובמקום בו הוא מתקדם. אימון דורש בריכות, לא שלוליות." לאחר מכן, ציין דוגמה אחת או שתיים למעלה.
האם בינה מלאכותית היא רעה באופן ייחודי?
היא מרוכזת: שבבים בעלי הספק גבוה ארוזים יחד יוצרים עומסי קירור גדולים. אבל מרכזי נתונים הם גם המקום שבו טכנולוגיית היעילות הטובה ביותר נוטה לנחות ראשונה [1][4].
מה אם פשוט נעביר הכל לקירור אוויר?
אולי נקצץ באתר אבל נגדיל את מחוץ לאתר באמצעות חשמל. מפעילים מתוחכמים שוקלים את שניהם [1][5].
ומה לגבי טכנולוגיה עתידית?
עיצובים שימנעו קירור מים בקנה מידה גדול יהיו מהפכניים עבור סקופ 1. חלק מהמפעילים נעים בכיוון הזה; חשמל במעלה הזרם עדיין נושא אות מים עד שהרשתות ישתנו [4].

הערות אחרונות - ארוך מדי, לא קראתי את זה 🌊

לכל הנחיה: חשבו על תת-מיליליטר עד עשרות מיליליטר, בהתאם לדגם, אורך ההנחיה והמקום שבו היא פועלת. חציון ההנחיה ~0.26 מ"ל במחסנית עיקרית אחת; ~45 מ"ל עבור תשובה של 400 אסימונים במחסנית אחרת [1][2].
אימון: מיליוני ליטרים עבור דגמים בחזית, מה שהופך את תזמון, מיקום וטכנולוגיית קירור לחיוניות [3].
מה לעשות: מודלים בגודל הנכון, בחירת אזורים בעלי רמת מים גבוהה, העברת עבודות כבדות לשעות קרירות יותר, העדפת ספקים המוכיחים עיצובים בעלי רמת מים נמוכה, ודרישת גבולות שקופים [1][3][4][5].

מטאפורה מעט פגומה לסיום: בינה מלאכותית היא תזמורת צמאה - המנגינה היא חישובית, אבל התופים מקררים ומפעילים מים. כוון את הלהקה, והקהל עדיין יקבל את המוזיקה בלי שהממטרות יתפוצצו. 🎻💦

הפניות

בלוג גוגל קלאוד - כמה אנרגיה משתמשת הבינה המלאכותית של גוגל? עשינו את החישוב (מתודולוגיה + ~0.26 מ"ל חציון של קישור
(קובץ PDF של מאמר טכני: מדידת ההשפעה הסביבתית של אספקת בינה מלאכותית בקנה מידה של גוגל.) קישור
Mistral AI - תרומתנו לתקן סביבתי עולמי לבינה מלאכותית (LCA עם ADEME/Carbone 4; ~281,000 מ"ק אימון + שימוש מוקדם; ~45 מ"ל לכל של 400 אסימונים תשובה קישור
לי ואחרים - הפיכת בינה מלאכותית לפחות "צמאה": גילוי וטיפול בטביעת הרגל הסודית של מודלים של בינה מלאכותית (אימון מיליוני ליטרים, מודע לזמן ולמקום , צריכת מים לעומת גזירה). קישור
מיקרוסופט - מרכזי נתונים מהדור הבא אינם צורכים מים כלל לקירור (תכנוני קירור ישיר לשבב המכוונים לקירור ללא מים באתרים מסוימים). קישור
מרכזי נתונים של גוגל - הפעלה בת קיימא (פשרות קירור אתר אחר אתר; דיווח ושימוש חוזר, כולל מים ממוחזרים/אפורים; סדרי גודל של שימוש יומיומי טיפוסי ברמת האתר). קישור

מצאו את הבינה המלאכותית העדכנית ביותר בחנות הרשמית של עוזרי בינה מלאכותית

אודותינו

חזרה לבלוג