שימי דביר
מודלי שפה
22/7/2024

מה זה שרשרת מחשבות ולמה כדאי להכיר את זה?

עיקרון "שרשרת מחשבות" במודלי שפה יכול להיות כלי מפתח לשיפור איכות התקשורת עם בינה מלאכותית. אבל מה זה בדיוק אומר ואיך משתמשים בזה? בכתבה הבאה אנחנו נציג לכם בצורה פשוטה איך אפשר להשתמש בטכניקה הזאת בצורה פשוטה, למה זה כל כך חשוב וגם מעט על מאחורי הקלעים

אחד העקרונות האהובים עליי במודלי שפה נקרא ״שרשרת מחשבות״, שזו דרך מעולה להפיק ממודל השפה תשובות הרבה יותר איכותיות שסגורות על עצמן.

איך זה מתקיים:

כאשר מבקשים ממודל השפה לפרט את כל הצעדים שהוא הולך לבצע, עצם זה שהוא ממפה את כל הצעדים עוזר לנו לוודא שהוא באמת הבין אותנו, אבל לא פחות מזה, זה גורם לו להפיק תשובה יותר איכותית ולבצע את המטלה בצורה מעט יותר מדויקת.

כשהוא ״חושב בקול״ ומתחיל לשרשר מחשבות של מה ואיך אפשר לעשות, ברוב המקרים הוא יגיע לתובנות טובות יותר מאשר בתשובה הראשונית שהוא יביא.

מעט על המאחורי הקלעים:

קונטקסט זה אחד הדברים הכי חשובים בשיחה שלנו עם מודל השפה, והרבה אנשים חושבים שמה שמגדיר את הקונטקסט של השיחה הוא הפרומפט שלנו בלבד, וזה בכלל לא נכון, כי הקונטקסט של השיחה מוגדר מ:

האינפוט שלי + האוטפוט של המודל = הקונטקסט.

כל מילה שהוא רושם לנו בתשובה שלו, מעדכנת שוב את הקונטקסט ועוזרת לו להפיק תשובה יותר טובה. לכן, אפשר להבין מזה שבעצם כך שמודל השפה רושם בעצמו את הצעדים שהוא הולך לבצע, הוא מחדד את הקונטקסט של המטלה מכיוון שהוא מופיע גם באינפוט, וגם באוטפוט.

מתי בפועל כדאי להשתמש בעקרון הזה?

  1. משימות מורכבות או רב-שלביות: כאשר המשימה שאנו מבקשים ממודל השפה לבצע מורכבת מכמה שלבים או דורשת התייחסות למספר היבטים שונים, שימוש בשרשרת מחשבות יכול לעזור למודל לארגן את התהליך ולהבטיח שכל השלבים מטופלים בצורה טובה.
  2. חשיבה לוגית ופתרון בעיות: כשנדרשת חשיבה לוגית או פתרון בעיות מורכבות, פירוט שלבי החשיבה מאפשר למודל לבחון כל צעד בתהליך ולוודא שהוא הגיוני ונכון.
  3. משימות הדורשות דיוק רב: במקרים בהם הדיוק חשוב במיוחד, כמו בניתוח נתונים או בכתיבת קוד, שרשרת המחשבות מאפשרת לנו לבדוק כל שלב ולוודא שאין טעויות או הנחות שגויות.
  4. תהליכי קבלת החלטות: כשנדרשת קבלת החלטה מורכבת, פירוט שיקולי המודל בכל שלב מאפשר לנו להבין את הלוגיקה מאחורי ההחלטה ולוודא שכל ההיבטים הרלוונטיים נלקחו בחשבון.
  5. משימות יצירתיות: גם במשימות יצירתיות, כמו כתיבת סיפור או יצירת תוכן שיווקי, שרשרת מחשבות יכולה לעזור למודל לפתח רעיונות בצורה מובנית ולוגית יותר.

בנוסף, כאשר אנחנו מפתחים פרומפט שמורכב ממספר גדול של הנחיות, אנחנו נרצה לבצע איתו תהליך של ולידציה ולהפעיל את עקרון ״שרשרת המחשבות״ כדי לוודא שמודל השפה יבצע את כל השלבים שנמצאים בתהליך שאנחנו מגדירים לו. לכן אנחנו נירשום בבסוף הפרומפט שלנו את ההנחיה הבאה:

לפני שאתה מתחיל, תרשום לי שלב אחרי שלב מה בדיוק הבנת מהבקשה שלי, במידה ואראה שהבנת אותי נכון, אני אאשר לך להתחיל

כאשר נעשה זאת, המודל לא יזניק ישר את התשובה שלו לפרומפט שרשמנו לו, אלא הוא יפרק את ההנחיה שלנו לגורמים וימפה לנו בדיוק את מה שהוא הבין ואת הצורה שבו הוא הולך לבצע את זה. כמו שאמרנו לפני זה, זה עוזר לנו לחדד את הקונטקסט של השיחה מכיוון שמודל השפה חוזר על ההנחיה באוטפוט שלו, ובמקרה הזה אנחנו יכולים בנוסף לוודא רק שהוא הבין אותנו טוב ולתקן אותו במידה והוא הבין אותנו לא נכון או במידה והוא צריך דיוק קטן.

כתבות נוספות