בינה מלאכותית מרגישה לפעמים כמעט כמו קסם. אתה מקליד שאלה אקראית, ובום - תשובה חלקה ומלוטשת מופיעה תוך שניות. אבל הנה העקומה: מאחורי כל מכונה "גאונית", יש אנשים אמיתיים שדוחפים, מתקנים ומעצבים אותה לאורך הדרך. האנשים האלה נקראים מאמני בינה מלאכותית , והעבודה שהם עושים מוזרה, מצחיקה יותר, ולמען האמת יותר אנושית ממה שרוב האנשים חושבים.
בואו נבחן מדוע המאמנים האלה חשובים, איך נראה באמת היומיום שלהם, ומדוע התפקיד הזה מתפוצץ מהר יותר ממה שמישהו צפה.
מאמרים שאולי תרצו לקרוא אחרי זה:
🔗 מהי ארביטראז' של בינה מלאכותית: האמת מאחורי מילת הבאזז
מסביר ארביטראז' של בינה מלאכותית, את הסיכונים, היתרונות והתפיסות המוטעות הנפוצות.
🔗 דרישות אחסון נתונים עבור בינה מלאכותית: מה שאתם באמת צריכים לדעת
מכסה את צרכי האחסון, יכולת ההרחבה והיעילות של מערכות בינה מלאכותית.
🔗 מי אבי הבינה המלאכותית?
חוקר את חלוצי הבינה המלאכותית ואת מקורותיה של הבינה המלאכותית.
מה הופך מאמן בינה מלאכותית למוצלח? 🏆
זו לא עבודה של לחיצה על כפתורים. המאמנים הטובים ביותר נשענים על שילוב די מוזר של כישרונות:
-
סבלנות (הרבה) - דוגמנים לא לומדים בבת אחת. מאמנים ממשיכים לעשות את אותם תיקונים עד שזה נדבק.
-
זיהוי ניואנסים - זיהוי סרקזם, הקשר תרבותי או הטיה הם מה שנותן למשוב האנושי את יתרונו [1].
-
תקשורת ישירה - חצי מהעבודה היא כתיבת הוראות ברורות שהבינה המלאכותית לא תוכל לקרוא לא נכון.
-
סקרנות + אתיקה - מאמן טוב מטיל ספק האם תשובה "נכונה עובדתית" אך אינה מדויקת מבחינה חברתית - נושא מרכזי בפיקוח על בינה מלאכותית [2].
במילים פשוטות: מדריך הוא חלקו מורה, חלקו עורך, וקורטוב של אתיקה.
סקירה חטופה של תפקידי מאמן בינה מלאכותית (עם כמה מוזרויות 😉)
| סוג תפקיד | מי הכי מתאים | שכר טיפוסי | למה זה עובד (או לא) |
|---|---|---|---|
| תוויות נתונים | אנשים שאוהבים פרטים עדינים | נמוך-בינוני $$ | חיוני לחלוטין; אם התוויות רשלניות, המודל כולו סובל [3] 📊 |
| מומחה RLHF | סופרים, עורכים, אנליסטים | בינוני-גבוה $$ | מדרג וכותב מחדש תשובות כדי להתאים את הטון והבהירות לציפיות האנושיות [1] |
| מאמן דומיינים | עורכי דין, רופאים, מומחים | בכל רחבי המפה 💼 | מטפל בז'רגון נישה ובמקרים קצה עבור מערכות ספציפיות לתעשייה |
| בודק בטיחות | אנשים בעלי חשיבה אתית | בינוני $$ | מיישמת הנחיות כך שבינה מלאכותית תמנע תוכן מזיק [2][5] |
| מאמן יצירתי | אמנים, מספרי סיפורים | בלתי צפוי 💡 | עוזר לבינה מלאכותית להדהד את הדמיון תוך שמירה על גבולות בטוחים [5] |
(כן, העיצוב קצת מבולגן - קצת כמו העבודה עצמה.)
יום בחייו של מאמן בינה מלאכותית
אז איך נראית העבודה בפועל? תחשבו על פחות קידוד זוהר ויותר:
-
דירוג תשובות שנכתבו על ידי בינה מלאכותית מהגרוע לטוב ביותר (שלב RLHF קלאסי) [1].
-
תיקון טעויות (כמו כאשר המודל שוכח שנוגה אינו מאדים).
-
כתיבה מחדש של תשובות צ'אטבוט כך שיישמעו טבעיות יותר.
-
תיוג הרים של טקסט, תמונות או אודיו - היכן שדיוק באמת חשוב [3].
-
דיון האם "תקין מבחינה טכנית" זה מספיק טוב או האם הנחיות הבטיחות צריכות לעקוף [2].
זה חלק טחינה, חלק פאזל. בכנות, דמיינו ללמד תוכי לא רק לדבר אלא להפסיק להשתמש במילים קצת לא נכונות - ככה זה. 🦜
למה מאמנים חשובים הרבה יותר ממה שאתם חושבים
ללא כיוון בני אדם, בינה מלאכותית הייתה:
-
צליל נוקשה ורובוטי.
-
הפצת הטיה ללא בדיקה (מחשבה מפחידה).
-
לגמרי מפספס הומור או אמפתיה.
-
להיות פחות בטוח בהקשרים רגישים.
מאמנים הם אלה שמכניסים פנימה את "הדברים האנושיים המבולגנים" - סלנג, חמימות, מטאפורה מגושמת מדי פעם - ובמקביל מיישמים מעקות בטיחות כדי לשמור על בטיחותם [2][5].
מיומנויות שבאמת חשובות
שכחו את המיתוס שאתם צריכים דוקטורט. מה שעוזר הכי הרבה הוא:
-
כישורי כתיבה ועריכה - טקסט מלוטש אך בעל צליל טבעי [1].
-
חשיבה אנליטית - זיהוי טעויות חוזרות ונשנות במודל ושיפורים בו.
-
מודעות תרבותית - לדעת מתי ניסוח עלול להיות שגוי [2].
-
סבלנות - כי הבינה המלאכותית לא תופסת את זה באופן מיידי.
נקודות בונוס עבור כישורים רב-לשוניים או מומחיות נישה.
היכן מאמנים מופיעים 🌍
העבודה הזו לא עוסקת רק בצ'אטבוטים - היא מתגנבת לכל מגזר:
-
שירותי בריאות - כתיבת כללי ביאור למקרים גבוליים (משתקפים בהנחיות בינה מלאכותית בתחום הבריאות) [2].
-
פיננסים - הכשרת מערכות לגילוי הונאות מבלי להטביע אנשים באזעקות שווא [2].
-
קמעונאות - לימוד עוזרי עבודה כיצד להשתמש בז'רגון קונים סלנגי תוך היצמדות לטון המותג [5].
-
חינוך - עיצוב בוטים של שיעורים פרטיים כמעודדים במקום מתנשאים [5].
בעיקרון: אם לבינה מלאכותית יש מקום בשולחן, יש מאמן שמסתתר ברקע.
החלק של האתיקה (אי אפשר לדלג על זה)
כאן זה הופך להיות משמעותי. אם לא מטפלים בה, בינה מלאכותית חוזרת על סטריאוטיפים, מידע שגוי או גרוע מכך. מאמנים עוצרים זאת באמצעות שיטות כמו RLHF או כללים חוקתיים שמכוונים מודלים לעבר תשובות מועילות ולא מזיקות [1][5].
דוגמה: אם בוט מפרסם המלצות משרה מוטות, מדריך מסמן זאת, כותב מחדש את ספר החוקים ומוודא שזה לא יקרה שוב. זוהי פיקוח בפעולה [2].
הצד הלא כל כך כיפי
לא הכל מבריק. מאמנים מתמודדים עם:
-
מונוטוניות - תיוג אינסופי מתיישן.
-
עייפות רגשית - סקירת תוכן מזיק או מטריד יכולה לגבות מחיר; מערכות תמיכה הן קריטיות [4].
-
חוסר הכרה - משתמשים לעיתים רחוקות מבינים שמאמנים קיימים.
-
שינוי מתמיד - הכלים מתפתחים ללא הפסקה, מה שאומר שהמאמנים צריכים לעמוד בקצב.
ובכל זאת, עבור רבים, הריגוש של עיצוב "המוח" של הטכנולוגיה משאיר אותם מרותקים.
ה-MVP הנסתרים של הבינה המלאכותית
אז מי הם מאמני בינה מלאכותית? הם הגשר בין אלגוריתמים גולמיים למערכות שבאמת עובדות עבור אנשים. בלעדיהם, בינה מלאכותית תהיה כמו ספרייה בלי ספרנים - המון מידע, אבל כמעט בלתי אפשרי להשתמש בו.
בפעם הבאה שצ'אטבוט יגרום לכם לצחוק או ירגיש לכם "מאוזן" באופן מפתיע, הודו למדריך. הם הדמויות השקטות שגורמות למכונות לא רק לחשב, אלא להתחבר [1][2][5].
הפניות
[1] Ouyang, L. et al. (2022). אימון מודלים של שפה לביצוע הוראות בעזרת משוב אנושי (InstructGPT). NeurIPS. קישור
[2] NIST (2023). מסגרת ניהול סיכונים של בינה מלאכותית (AI RMF 1.0). קישור
[3] נורת'קאט, סי. ואחרים (2021). שגיאות תווית נרחבות בערכות בדיקה מערערות את היציבות של מדדי למידת מכונה. מערכי נתונים ו-benchmarks של NeurIPS. קישור
[4] ארגון הבריאות העולמי/ארגון העבודה הבינלאומי (2022). הנחיות בנושא בריאות הנפש בעבודה. קישור
[5] באי, י. ואחרים (2022). בינה מלאכותית חוקתית: חוסר נזק ממשוב של בינה מלאכותית. arXiv. קישור