Uncategorized 22/01/2026 26 דק׳ קריאה

מדריך מלא: הקמת AI לקוד על שרת CPU בלבד עם RAG + שמירת שאלות/תשובות ב-MySQL (PHP 8.3 / Python / JS / SQL)

pablo guides · 0 תגובות

מדריך מלא: הקמת AI לקוד על שרת CPU בלבד עם RAG + שמירת שאלות/תשובות ב-MySQL (PHP 8.3 / Python / JS / SQL)

מטרה: לבנות “עוזר מתכנת” שמבין את הקוד שלך באמת, עונה עם הקשר מהפרויקט (RAG), מציע תיקונים מלאים, ושומר כל שאלה/תשובה במסד נתונים.

הגבלות CPU בלבד: בלי GPU לא מאמנים מודלים ענקיים בפועל. במקום זה משתמשים ב-RAG כדי “להאכיל” את העוזר בקוד אמיתי מתוך הפרויקט. זה נותן תוצאות פרקטיות ומקצועיות במיוחד לקוד.

תוכן עניינים

דרישות והכנות
מבנה תיקיות מומלץ
התקנת llama.cpp
הורדת מודל GGUF לקוד
הרצת שרת מודל (llama-server)
התקנת רכיבי RAG (Chroma + Embeddings) בלי venv
יצירת טבלת MySQL ללוגים
קובץ הגדרות .env (DB user/pass/name)
הרשאות קריאה לקוד שלך (ACL)
סקריפט אינדוקס: ingest_repo.py
אינדוקס בפועל + בדיקת Retrieval
שרת RAG API: rag_api.py
הרצה 24/7 עם screen + לוגים
פתיחת פורטים (UFW)
בדיקות curl + אימות שמירה ב-MySQL
העלאת הפרויקט ל-GitHub כריפו חדש
טיפים לשדרוג איכות לקוד

1) דרישות והכנות

Ubuntu Server
ללא GPU
RAM ~ 20GB
MySQL 8.0 קיים (DB קיים – אתה רק מזין שם/משתמש/סיסמה)
נתיב הקוד לאינדוקס: /home/raviti/htdocs/raviti.net/code/
נתיבים קיימים אצלך:
- /root/llama.cpp
- /root/models/gguf
- /root/ai_coder
- /root/hf

2) יצירת מבנה פרויקט (ai_coder)

המערכת עצמה תהיה ב-/root/ai_coder. הקוד של האתר נשאר במקום שלו – אנחנו רק קוראים אותו.

מדריך מלא: הקמת AI לקוד על שרת CPU בלבד עם RAG + שמירת שאלות/תשובות ב-MySQL (PHP 8.3 / Python / JS / SQL)

תוכן עניינים

1) דרישות והכנות

2) יצירת מבנה פרויקט (ai_coder)

3) התקנת llama.cpp (אם עדיין לא מותקן)

4) הורדת מודל GGUF שמצטיין בקוד (מומלץ ל-CPU)

5) הרצת שרת מודל (llama-server) – API מקומי

6) התקנת רכיבי RAG (ללא venv) + קאש HuggingFace

7) MySQL: יצירת טבלת לוגים לשאלות/תשובות

8) יצירת קובץ .env עם פרטי MySQL + קונפיג RAG

9) הרשאות קריאה לנתיב הקוד (ACL) – אם יש Permission denied

10) סקריפט אינדוקס RAG: ingest_repo.py (גרסת PRO ל-PHP/Python/JS/SQL)

11) אינדוקס בפועל (מומלץ להתחיל מאינדקס נקי)

12) בדיקת Retrieval בלבד (לוודא שהוא באמת שולף קבצים מהפרויקט)

13) שרת RAG API: rag_api.py (כולל שמירה ל-MySQL)

14) הרצה 24/7 עם screen (מומלץ לפרודקשן)

14.1 שרת המודל (llama-server) ב-screen

14.2 שרת ה-RAG API ב-screen

14.3 צפייה בלוגים

15) פתיחת פורטים ב-UFW (אם צריך גישה מבחוץ)

16) בדיקות curl + אימות שמירה ב-MySQL

16.1 בדיקת API

16.2 אימות שנשמר ב-DB

17) העלאה ל-GitHub כריפו חדש (פרויקט ai_coder)

17.1 .gitignore

17.2 init + commit + push

18) טיפים לשדרוג “איכות קוד” (מאוד מומלץ)

סיכום

19) האכלת המערכת בעמודי HTML (wget) לתיקייה קבועה + שמירה ל-MySQL + אינדוקס RAG לקוד

19.1 יצירת תיקיית HTML

19.2 הורדת HTML מ-Kali Tools (עמוד רשימת הכלים)

19.3 הורדת מדריך Hostinger (Kali Linux tutorial) בצורה ממוקדת

19.4 הורדת pablo-guides.com (שלך) – בצורה מלאה יותר

19.5 GitHub repos — לא wget. עושים git clone ומכניסים ל-RAG כקוד

19.6 MySQL: טבלאות לאחסון HTML ודאטה שחולץ

19.7 התקנת ספריות חילוץ HTML (BeautifulSoup)

19.8 סקריפט PRO: אינג’סט HTML + דגש על קטעי קוד + שמירה ל-MySQL + אינדוקס ל-Chroma

19.9 עדכון .env עבור HTML_DIR

19.10 הרצת אינג’סט HTML אחרי wget

20) GitHub repos: איך “להאכיל” את ה-AI בקוד אמיתי מריפואים רבים

20.1 יצירת “ספריית ריפואים” קבועה

20.2 קלונינג רשימת ריפואים מקובץ טקסט

21) אינדוקס גם של הקוד שלך וגם של ריפואי GitHub (2 נתיבים)

21.1 עדכון .env: להגדיר CODE_SOURCES

21.2 גרסת ingest_repo.py שתומכת במספר נתיבים

21.3 הרצת אינדוקס קוד מחדש

22) “שם AI משלך”: pablo-rotem-coder + (context tokens) + פרסום ל-Hugging Face

22.1 יצירת תיקיית פרסום נקייה + README

22.2 התחברות ל-Hugging Face + יצירת ריפו + העלאה עם Git-LFS

23) זרימת עבודה מומלצת (אוטומציה שבועית/יומית)

24) למה זה ישפר קידוד בצורה דרמטית

25) בדיקה אחת שמוכיחה שהכל עובד