דלג לתוכן

בדיקה והפצה של סקילס

מדריך לבדיקה, שיפור איטרטיבי והפצה של סקילס AI: כתיבת evals, מדידת ביצועים, איטרציה על תיאור הסקיל, גרסאות semver, פרסום ל-GitHub ופתרון בעיות נפוצות.

מאת Skills IL Teamפורסם ב 1 בפברואר 202610 דקות קריאה
בדיקותהפצהפתרון בעיותאיטרציהAPI

גישות בדיקה

אפשר לבדוק סקילס בכמה דרכים:

  • בדיקה ידנית - הריצו בקשות ישירות בסוכן שלכם וראו מה קורה. מהיר, בלי הכנות.
  • בדיקה עם סקריפטים - כתבו מקרי בדיקה שניתן להריץ אוטומטית בסוכני קוד כמו Claude Code או Cursor.
  • בדיקה דרך API - בנו מערכי בדיקה שרצים באופן שיטתי.

טיפ: תתחילו ממשימה אחת. תשפרו אותה עד שהיא עובדת מושלם, ואז תהפכו את הגישה שעבדה לסקיל.

בדיקות מומלצות

1. בדיקות הפעלה (Triggering)

מטרה: ודאו שהסקיל נטען בזמנים הנכונים.

Should trigger: - "Help me set up a new ProjectHub workspace" - "I need to create a project in ProjectHub" - "Initialize a ProjectHub project for Q4 planning" Should NOT trigger: - "What's the weather in San Francisco?" - "Help me write Python code" - "Create a spreadsheet"

2. בדיקות פונקציונליות

מטרה: ודאו שהסקיל מייצר פלט נכון.

Test: Create project with 5 tasks Given: Project name "Q4 Planning", 5 task descriptions When: Skill executes workflow Then: - Project created in ProjectHub - 5 tasks created with correct properties - All tasks linked to project - No API errors

3. השוואת ביצועים

מטרה: הראו שעם הסקיל התוצאות טובות יותר מבלעדיו.

Without skill: - User provides instructions each time - 15 back-and-forth messages - 3 failed API calls requiring retry - 12,000 tokens consumed With skill: - Automatic workflow execution - 2 clarifying questions only - 0 failed API calls - 6,000 tokens consumed

שימוש ב-skill-creator

ה-skill-creator זמין ב-Skills IL ועוזר לבנות ולשפר סקילס:

  • יצירה: מייצר סקילס מתיאורים בשפה טבעית עם SKILL.md מפורמט נכון
  • ביקורת: מזהה בעיות נפוצות, מציע מקרי בדיקה
  • שיפור: אחרי שימוש ומציאת edge cases, הביאו דוגמאות בחזרה לשיפור

התקינו את יוצר הסקילס מ-Skills IL →

שיפור איטרטיבי

סקילס הם מסמכים חיים. צפו לשפר אותם לאורך הזמן:

סימנים שהסקיל לא מופעל מספיק

  • הסקיל לא נטען כשצריך
  • משתמשים צריכים להפעיל ידנית
  • שאלות על מתי להשתמש בו

פתרון: הוסיפו פרטים ו-keywords לתיאור

סימנים שהסקיל מופעל יותר מדי

  • הסקיל נטען לבקשות לא קשורות
  • משתמשים מכבים אותו
  • בלבול לגבי המטרה

פתרון: הוסיפו negative triggers, היו יותר ספציפיים

בעיות ביצוע

  • תוצאות לא עקביות
  • כשלונות API
  • תיקוני משתמש נדרשים

פתרון: שפרו הוראות, הוסיפו טיפול בשגיאות

הפצה

מודל ההפצה הנוכחי

למשתמשים בודדים:

  1. הורידו את תיקיית הסקיל
  2. התקינו באמצעות פקודת ההתקנה של הסוכן שלכם (לדוגמה: npx skills-il add skill-name)
  3. או מקמו ידנית בתיקיית הסקילס של הסוכן

ברמת ארגון:

  • מנהלים יכולים לפרוס סקילס לכל הארגון
  • עדכונים אוטומטיים
  • ניהול מרכזי

שימוש דרך API

לתרחישים תכנותיים - כמו בניית אפליקציות, סוכנים או תהליכי עבודה אוטומטיים:

  • שילוב עם Claude Agent SDK, Cursor Rules, או OpenClaw
  • הוספת סקילס לתהליכי עבודה אוטומטיים
  • ניהול גרסאות דרך ממשק הניהול של הסוכן

גישה מומלצת

  1. אחסנו ב-GitHub - ריפו ציבורי, README ברור, דוגמאות שימוש
  2. תעדו בריפו ה-MCP - קישור לסקילס, הסבר הערך המשולב
  3. צרו מדריך התקנה מפורט

פתרון בעיות

סקיל לא עולה

שגיאה: "Could not find SKILL.md"

  • שנו שם ל-SKILL.md (רגיש לאותיות)

שגיאה: "Invalid frontmatter"

  • ודאו --- delimiters
  • בדקו ציטוטים סגורים

שגיאה: "Invalid skill name"

  • השתמשו ב-kebab-case בלבד

סקיל לא מופעל

סימפטום: הסקיל אף פעם לא נטען אוטומטית.

מה לבדוק:

  • האם התיאור כללי מדי?
  • האם יש בו ביטויים שמשתמשים אומרים?
  • האם מוזכרים סוגי קבצים רלוונטיים?

טיפ לדיבאג: שאלו את הסוכן: "When would you use the [skill name] skill?" - הוא יצטט את התיאור ותוכלו לראות מה חסר.

סקיל מופעל יותר מדי

פתרונות:

  1. הוסיפו negative triggers בתיאור
  2. היו יותר ספציפיים
  3. הבהירו את ה-scope

הוראות לא נשמרות

סיבות נפוצות:

  1. הוראות ארוכות מדי - קצרו, השתמשו ברשימות
  2. הוראות קבורות - שימו הוראות קריטיות בראש
  3. שפה מעורפלת - היו ספציפיים ומפורשים

טכניקה מתקדמת: לבדיקות חשובות, שווה לצרף סקריפט שבודק את התוצאות בקוד. קוד נותן תוצאה חד-משמעית, שפה טבעית לא.

בעיות הקשר גדול

סיבות: תוכן סקיל גדול מדי, יותר מדי סקילס פעילים

פתרונות:

  1. שמרו SKILL.md מתחת ל-5,000 מילים
  2. העבירו תיעוד מפורט ל-references/
  3. הפעילו סקילס באופן סלקטיבי (הימנעו מיותר מ-20-50 פעילים)

משאבים