תגית: perl

לאן פרל נעלמה אצלי ?

לפני שבוע חבר ביקש ממני סיוע במיון סוגי אימלים שיש לו בלוג (שרת SMTP).
הוא היה צריך לקחת מידע ממספר שורות ולאחד אותם לפי מזהה מסויים שנמצא בלוג (מספר מזהה השליחה), אבל רק כאשר מתקיים משהו מסויים שם. חיפשתי בהתחלה עבורו כלי שאולי קיים לנושא, וכאשר גיליתי שאין ולו אחד כזה, הבנתי שצריך לכתוב אחד.

אז הוא שאל אותי אם אוכל לסייע לו ולהראות לו איך לעשות את זה בפרל, וכאשר הבנתי שאין הגבלה של טכנולוגיה (אלא הוא דיבר על פרל בזכות יכולות הניתוח של השפה), המחשבה הראשונה שלי היתה לכתוב את זה ברובי.

אחרי שסיפקתי לחבר הדגמה על קובץ לוג אחד לדוגמא ששלח לי, הוא אמר לי שהמערכת שלי לא עובדת. מסתבר שהקובץ אצלו הוא עם gzip בגלל ה logrotate. שינוי של 2 שורות בלבד ברובי גרמו לקוד שלי לעבוד. אפילו לא היה צורך להתקין gem מסויים, זה היה פשוט מידי ועבד עם ה stdlib של רובי:

...
require 'zlib'
...
Zlib::GzipReader.open(file).each do |line|
...
end
...

הקוד עצמו לקח לי משהו כמו 40 שורות קוד בגלל שעשיתי את זה בדרך הקריאה, כולל אפשרות לדבג את הנעשה בקוד, ולא בדרך הקצרה לכתיבה (אשר היתה הופכת את זה בערך ל15-20 שורות קוד).

הבחירה של רובי עבור ניהול מערכת אינה נראת להרבה אנשים כמו משהו אפשרי, כי רובם חושבים על רובי כשפה לפיתוח ווב, ולא כשפת פיתוח דינאמית לכל דבר ועניין.
ואם להוסיף חטא על פשע, אז רובי נחשבת בעיני רבים לאיטית מאוד, אבל זו לא השפה אלא אחד המפרשים שלה – MRI, אשר הוא המפרש הראשי, אך לא היחיד לשפה, אך כאשר מהירות אינה חשובה, המפרש הזה של רובי עושה עבודה מצויינת, כל עוד עבודה עם threads אינה חשובה.

אם פעם כאשר היו מבקשים ממני לנתח ככה מידע, אז פרל היה קופץ לי מיד לראש, והייתי מדמיין איך זה נעשה בשפה, כיום לוקח לי זמן לחשוב איך לממש את זה בשפה, בו בזמן שאני יכול לחשוב על מספר דרכים לממש את זה ברובי בלי להשקיע מאמץ.

מדהים להתעורר יום אחד ולגלות שהטכנולוגיות שאתה מחובר ואוהב השתנו ואתה אפילו לא שמת לב לכך.

Working with Shared Libraries in Perl

Here are my slides for a lecture I gave at Perl mongers:

In case you'll download the slides, you'll also have my notes inside.
Enjoy 🙂

regular expression על קצה הפוסט – חלק ראשון

עולם המתכנתים מתחלק לשלושה חלקים:

  1. אלו אשר משתמשים ב Regex‏
  2. אלו אשר שמעו על Regex‏
  3. אלו שחושבים שאני מקלל אותם כרגע

פוסט זה נכתב עבור האנשים שרק שמעו קצת על הנושא, ואלו שבכלל לא.

Regular Expression או Regex כקיצור, זו למעשה שפה המאפשרת לתאר תבנית מסויימת של טקסט שרוצים למצוא או לשנות.

ישנן הרבה מימושים לשפה, כאשר כל מימוש מספק יכולות שונות – בעיקר תוספות למימוש הבסיסי ביותר. אחת הידועות ביותר נקראת Perl Compatible Regular Expression או PCRE בקיצור .אך התקן הבסיסי ביותר שיש עבור השפה, בכלל שייכת לPOSIX.

לעין בלתי רגילה, הקוד נראה כמו אסופה של ג'יבריש, אבל ככול שמבינים יותר את השפה, קל יותר להבין אותה (אלא אם מתעללים בה), אבל לוקח לעיניים כל פעם מחדש קצת זמן להתרגל לתחביר.

המטרה של Regex היא למצוא מבנה (תבנית) בעל חוקיות מסויימת אשר בכל דרך אחרת, תהיה זו משימה מסובכת יותר לגילוי. העניין הוא, שregex במידה והמבנה ידוע מראש, אינו יהיה יעיל כמו חילוץ מידע בצורה לינארית. ועל כן השימוש בRegex נבנה עבור השימוש בתבניות, ומומלץ לא להשתמש בו עבור משהו פשוט יותר.

למשל, במידה ואנחנו בהכרח יודעים כי המחרוזת תראה כך:

Hello World

כלומר, אנחנו מחפשים מבנה מחרזות שהיא בהכרח תהיה Hello World (כאשר H גדולה, השאר אותיות קטנות, אז רווח ואז W גדולה, והשאר אותיות קטנות), אז השימוש ב Regex אינו יעיל, היות והוא אינו תורם לנו שום דבר מיוחד בנושא, למרות שניתן להשתמש בו במקרה זה. אך החיפוש הרגיל של מחרוזות בהכרח יהיה יעיל ומהיר יותר בנושא.
לעומת זאת, כאשר נרצה לדעת האם מדובר באוסף אותיות (אפילו התחלה באות גדולה בכל התחלת "מילה"), רווח, ועוד אוסף אותיות (שוב פעם עם אות גדולה), אז דווקא לRegex יתרון ברור, היות ואנחנו מחפשים תבנית, ולא אסופת תווים מדוייקת. שימוש ב Regex בסיסי לשם כך יראה בצורה הבאה:

^([\w]+)\s([\w]+)$

נראה כמו ג'יבריש אני יודע. בפוסט הבא אסביר גם מה המשמעות.
המראה הבסיסי של השפה מתארת מספר דברים: להמשיך לקרוא