להבין את load average ביוניקס

כל מי שעובד ביוניקס מספיק זמן מגלה את load average. ניתן להגיע אליו דרך הפקודות top, procinfo, w ו uptime. העניין הוא שלא הרבה יודעים מה זה בעצם אומר. אז אני אנסה להסביר כאן בקצרה (ובצורה מאוד לא ממצה, אבל מספיק ברורה אני מקווה) מה זה אומר.

ובכן אם נסתכל על ה load average אנחנו נראה שהוא מורכב מ3 קבוצות של מספרים:

load average: 0.40, 0.46, 0.47

הקבוצות מייצגות זמן. הקבוצה הראשונה מייצגת דקה, הקבוצה השנייה 5 דקות והקבוצה השלישית 15 דקות.

הקבוצות מראות בפרק זמן של כל אחת ואחת כמה תהליכים (process) מחכים לריצה מול מה שכבר הורץ באותו פרק זמן מבחינת ביצוע הפקודות על ידי המעבדים.

ככול שהמספר נמוך יותר, ככה המערכת שלכם פחות עמוסה. אנשי יוניקס בסאן אומרים שכל מספר מתחת ל3 אומר שהמערכת במצב טוב.

אם המערכת מפסיקה להגיב בזמן סביר, אז אתם אפילו לא צריכים מן הסתם להסתכל במדדים הללו בשביל לדעת שמשהו לא תקין.

לקריאה מקיפה יותר אתם מוזמנים לגשת לקישורים הבאים:

http://www.lifeaftercoffee.com/2006/03/13/unix-load-averages-explained/

http://www.crucialp.com/resources/tutorials/server-administration/server-loads-explained-linux-unix.php

http://www.teamquest.com/resources/gunther/display/5/index.htm

http://en.wikipedia.org/wiki/Load_(computing)

7 מחשבות על “להבין את load average ביוניקס

  1. צפריר כהן

    זה קשור גם למספר המעבדים (לצורך העניין כל ליבה היא מעבד נפרד).

    אם יש לכם מערכת עם ארבעה מעבדים ויש תהליך שרץ כל הזמן על אחד מהם (השאר לא עושים כלום), העומס יהיה 1. אם תהליך נוסף ירוץ כל הזמן: העומס יעלה ל־2. יהיו במערכת עדיין שני מעבדים שלא עושים כלום.

    אם העומס קרוב למספר המעבדים או אף גבוה ממנו: זה לא טוב. יש תהליכים שמחכים למעבד ולכן תהיה תגובה איטית. המערכת חנוקה.

    צריך גם לזכור שהעומס שרואים הוא ממוצע על פני זמן מסויים. לכן יכול קורה שרואים עכשיו את העומסים של העבר הקרוב למרות שכבר השתרר שקט.

  2. elcuco

    מצד שי, בניגוד למה שצפריר הסביר…

    אם המערכת עמוסה – בקרנלים חדשים (מעל 2.6) גם כאשר המערכת יש לה load average של 5 או 10 לפעמים המערכת תעבוד מצויין. הבעייה היחידה היא עם IO – כאשר יש IO אתה בצרות ותקבל load average גבוהה ואין לך איך לטפל בזה.

    אני ראיתי מערכת עם 14 וגם 30 או 50… ואללה לא זוכר🙂

  3. צפריר כהן

    רוב המערכות שראיתי עם "עומס גבוה" היו כאלו שבדיוק "השתחרר להם הפקק". כשהעומס ממש גבוה המערכת כ"כ חנוקה ולכן אני לא יכול לראות כלום. מייד לאחר שהשתחרר העומס עדיין אפשר לראות את העומס מהעבר.

  4. Lior Kaplan

    מתוך man proc:

    /proc/loadavg – The first three fields in this file are load average figures giving the number of jobs in the run queue (state R) or waiting for disk I/O (state D) averaged over 1, 5, and 15 minutes.

    וזאת גם הסיבה כאשר מכונה מחכה ל-I/O אז יש לה Load גבוה.

כתיבת תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s